BEGIN:VCALENDAR
VERSION:2.0
PRODID:-//Laboratoire de Mathématiques de Versailles - ECPv6.16.4//NONSGML v1.0//EN
CALSCALE:GREGORIAN
METHOD:PUBLISH
X-WR-CALNAME:Laboratoire de Mathématiques de Versailles
X-ORIGINAL-URL:https://lmv.math.cnrs.fr
X-WR-CALDESC:Évènements pour Laboratoire de Mathématiques de Versailles
REFRESH-INTERVAL;VALUE=DURATION:PT1H
X-Robots-Tag:noindex
X-PUBLISHED-TTL:PT1H
BEGIN:VTIMEZONE
TZID:Europe/Paris
BEGIN:DAYLIGHT
TZOFFSETFROM:+0100
TZOFFSETTO:+0200
TZNAME:CEST
DTSTART:20250330T010000
END:DAYLIGHT
BEGIN:STANDARD
TZOFFSETFROM:+0200
TZOFFSETTO:+0100
TZNAME:CET
DTSTART:20251026T010000
END:STANDARD
BEGIN:DAYLIGHT
TZOFFSETFROM:+0100
TZOFFSETTO:+0200
TZNAME:CEST
DTSTART:20260329T010000
END:DAYLIGHT
BEGIN:STANDARD
TZOFFSETFROM:+0200
TZOFFSETTO:+0100
TZNAME:CET
DTSTART:20261025T010000
END:STANDARD
BEGIN:DAYLIGHT
TZOFFSETFROM:+0100
TZOFFSETTO:+0200
TZNAME:CEST
DTSTART:20270328T010000
END:DAYLIGHT
BEGIN:STANDARD
TZOFFSETFROM:+0200
TZOFFSETTO:+0100
TZNAME:CET
DTSTART:20271031T010000
END:STANDARD
END:VTIMEZONE
BEGIN:VEVENT
DTSTART;TZID=Europe/Paris:20260217T144500
DTEND;TZID=Europe/Paris:20260217T154500
DTSTAMP:20260620T205800
CREATED:20260116T214506Z
LAST-MODIFIED:20260220T084249Z
UID:14710-1771339500-1771343100@lmv.math.cnrs.fr
SUMMARY:PS : Maxime Sangnier (LPSM\, Sorbonne Université) : Sous-échantillonnage pour l'apprentissage supervisé non-paramétrique dans les RKHS
DESCRIPTION:Avec l’accroissement drastique du volume de données\, le sous-échantillonnage est devenu une pratique courante en apprentissage statistique. Sélectionnant un sous-groupe d’individus sur lequel le classifieur (ou le régresseur) va être entraîné\, le sous-échantillonnage vise à réduire le coût et le temps de calcul de la procédure d’estimation\, et conduit idéalement à une diminution de la consommation énergétique et de l’impact carbone de celle-ci. Nous étudions ici un cadre non-paramétrique\, dans lequel l’estimateur est une fonction de décision appartenant à un espace de Hilbert à noyau reproduisant (RKHS)\, et obtenu par minimisation d’un risque empirique repondéré à la Horvitz-Thompson. Par l’étude des propriétés asymptotiques de cet estimateur\, nous mettons à jour un plan de sous-échantillonnage optimal (au sens de la trace de la matrice de variance-covariance) et montrons que celui-ci peut être approximativement mise en œuvre par plug-in. Une étude numérique sur jeux de données simulées et réel montre la faisabilité et le gain empiriques de l’approche proposée.
URL:https://lmv.math.cnrs.fr/evenenement/ps-maxime-sangnier-lpsm-sorbonne-universite/
LOCATION:Bâtiment Fermat\, salle 4205
CATEGORIES:Séminaire PS
END:VEVENT
BEGIN:VEVENT
DTSTART;TZID=Europe/Paris:20260217T160000
DTEND;TZID=Europe/Paris:20260217T170000
DTSTAMP:20260620T205800
CREATED:20260116T214750Z
LAST-MODIFIED:20260220T084256Z
UID:14712-1771344000-1771347600@lmv.math.cnrs.fr
SUMMARY:PS : Erwan Scornet (LPSM et SCAI) : Théorie des forêts aléatoires : étude asymptotique dans un cadre de classification déséquilibrée
DESCRIPTION:Les forêts aléatoires (Breiman\, 2001) font partie des algorithmes d’apprentissage automatique les plus utilisés pour résoudre des problèmes d’apprentissage supervisé. Elles agrègent les prédictions de plusieurs arbres de décision\, dont la construction présente une dépendance complexe en les données d’apprentissage. De plus\, elles impliquent différents mécanismes de ré-échantillonnage\, ce qui rend leur analyse théorique difficile.\nDans ce travail\, nous nous plaçons dans un contexte de classification binaire\, et analysons une version simplifiée des forêts aléatoires : la forêt centrée. Nous établissons un théorème central limite pour la prédiction des forêts centrées en un point donné\, avec des taux de convergence exacts et des conditions explicites sur la structure des arbres composant la forêt. Ce résultat permet de construire des intervalles de confiance asymptotique pour la probabilité cible. Nous étudions ensuite l’apprentissage déséquilibré\, dans lequel une classe est sous-représentée par rapport à l’autre. Théoriquement et empiriquement\, nous prouvons que les stratégies de rééquilibrage communément utilisées dans ce contexte sont biaisées mais peuvent être modifiées pour conduire à une réduction asymptotique de la variance. \nCette présentation s’appuiera sur l’article suivant : https://arxiv.org/pdf/2506.08548
URL:https://lmv.math.cnrs.fr/evenenement/erwan-scornet-lpsm-et-scai-theorie-des-forets-aleatoires-etude-asymptotique-dans-un-cadre-de-classification-desequilibree/
LOCATION:Bâtiment Fermat\, salle 4205
CATEGORIES:Séminaire PS
END:VEVENT
END:VCALENDAR