PS : Maxime Sangnier (LPSM, Sorbonne Université) : Sous-échantillonnage pour l’apprentissage supervisé non-paramétrique dans les RKHS

17 février / 14:45 - 15:45

Avec l’accroissement drastique du volume de données, le sous-échantillonnage est devenu une pratique courante en apprentissage statistique. Sélectionnant un sous-groupe d’individus sur lequel le classifieur (ou le régresseur) va être entraîné, le sous-échantillonnage vise à réduire le coût et le temps de calcul de la procédure d’estimation, et conduit idéalement à une diminution de la consommation énergétique et de l’impact carbone de celle-ci. Nous étudions ici un cadre non-paramétrique, dans lequel l’estimateur est une fonction de décision appartenant à un espace de Hilbert à noyau reproduisant (RKHS), et obtenu par minimisation d’un risque empirique repondéré à la Horvitz-Thompson. Par l’étude des propriétés asymptotiques de cet estimateur, nous mettons à jour un plan de sous-échantillonnage optimal (au sens de la trace de la matrice de variance-covariance) et montrons que celui-ci peut être approximativement mise en œuvre par plug-in. Une étude numérique sur jeux de données simulées et réel montre la faisabilité et le gain empiriques de l’approche proposée.

Détails

Date : 17 février
Heure :
14:45 - 15:45
Catégorie d’Évènement: Séminaire PS

Lieu

Bâtiment Fermat, salle 4205

Organisateur

Ester Mariucci