Modélisation, analyse statistique, et applications en écologie et climatologie

Les mercredi 19 mars après-midi et jeudi 20 mars matin,

nous avons le plaisir d’organiser une journée d’échanges dédiée à la modélisation et à l’analyse statistique des données issues d’applications en écologie et climatologie. Ce workshop vise à rassembler des experts, des chercheurs et des étudiants passionnés par ces thématiques, afin de stimuler les discussions, favoriser le partage de connaissances et encourager des collaborations fructueuses. Au programme, six conférenciers partageront leurs recherches et expériences autour de l’utilisation de modèles statistiques avancés et de méthodes probabilistes. Les présentations couvriront des sujets variés, tels que la modélisation des données écologiques, la statistique des valeurs extrêmes, l’apprentissage statistique, les processus stochastiques, ainsi que leurs applications en biologie et climatologie.

Organisatrice : Ester Mariucci (LMV, UVSQ)

Intervenants :

  • Aurélie Fischer (LPSM, Université Paris Cité);
  • Juliette Legrand (Université de Bretagne Occidentale);
  • Adeline Leclercq Samson (LJK, Université Grenoble Alpes);
  • Stéphane Robin (LPSM, Sorbonne Université) :
  • Charline Smadi (Institut Fourier, Université Grenoble Alpes);
  • Julien Worms (LMV, UVSQ)

Le workshop a lieu à l’UFR des Sciences, bâtiment Fermat, en présentiel uniquement. Le mercredi 19 mars les exposés seront en amphi F et en amphi I le jeudi 20 mars.

 

Programme :

Mercredi 19 mars 2025

  •  15h00-15h45 : Stéphane Robin :
    Improving the variational inference of latent variable models in ecologyLatent variable models are a basic tool in ecology, particularly in community ecology. In particular, we will present the log-normal Poisson model (PLM), which provides a general framework for the joint distribution of several species in different environments, and the stochastic block model (SBM), which can be used to search for structure in an observed network of interactions between species. The usual tool for inferring latent variable models is the EM algorithm, which requires at least partial knowledge of the conditional distribution of latent variables conditional to observed variables. For many models, including PLN and SBM, this step is unfeasible, and so we generally resort to a so-called variational approximation of this conditional distribution, resulting in approximate inference. While variational algorithms are computationally efficient, they do not come with desirable guarantees such as consistency or asymptotic normality of estimators. We will present two different approaches based on Monte-Carlo approximations, which, starting from variational inference, lead to estimators with the usual guarantees. The presentation will be illustrated by examples from evolution and ecology. This is a joint work with Sophie Donnet (INRAE) and Julien Stoehr (Université Paris Dauphine).

 

  • 15h45-16h30 : Adeline Leclercq Samson :
    Some statistical models to quantify the effect of climate change on whales in GreenlandHuman activities have a profound impact on marine ecology in Greenland. In this presentation, I will focus on a study of the impact of these anthropogenic activities on narwhals, one of the endemic species of whales in Greenland. I will present different stochastic models to analyze the data from this study: point process with memory, stochastic Langevin diffusions, stochastic diffusions in a constraint domain. I will discuss more in detail the diffusion processes which can be multidimensional, hypoelliptic (with a degenerate noise) and partially observed. I will discuss the question of parameter estimation when only discrete observations are available. New estimation methods involve numerical schemes called splitting schemes, that prove to be numerically very stable.

 

  • 16h30-17h00 : Pause
  • 17h00-17h45 : Juliette Legrand :
    Rainfall modelling with compound discrete EGPD

    This study aims to develop a stochastic generator for high temporal resolution rainfall data at one location. Given the discrete nature of such data, we consider a compound Poisson process to model rainfall events. To ensure realistic modelling across the full range of rainfall intensities, from moderate to extreme, the extended generalized Pareto distribution (EGPD) is considered for the sizes of the jumps. In addition, to account for the strong temporal dependencies, inherent in rainfall data due to the underlying meteorological phenomena, we propose a discretized variation of a trawl process, called tetris process, which simply corresponds to a specific moving average process. This is a joint work with Pierre Ailliot and Carlo Gaetan.

Jeudi 20 mars 2025

  •  9h30-10h15 : Julien Worms :
    Estimation de probabilités de records pour données climatiques non stationnaires

    Les dernières années ont vu l’inflation inquiétante de survenue de records climatiques sur la planète et au niveau local. Dans la littérature sur les records, ce sont souvent uniquement les propriétés probabilistes de ceux-ci qui sont étudiées, et des techniques ou tests pour évaluer à quel point les données s’éloignent d’un cadre stationnaire. Mais rares sont les solutions au problème de l’estimation proprement dite des probabilités de records, qui plus est dans un cadre non gaussien et/ou non-stationnaire, qui s’impose lorsque l’on parle de records climatiques. Dans cet exposé, nous proposerons des solutions semi-paramétriques pour un tel cadre, adaptées à l’estimation des probabilités de record d’une variable climatique, et ne nécessitant pas l’observation de nombreux records. Nous présenterons des applications d’une part dans un contexte de données de températures
    issues de GCM à l’échelle du globe, d’autre part pour des données observationnelles pour lesquelles nous nous intéresserons au concept de record spatio-temporel. Ce sera l’occasion
    de discuter des avantages et des limites des techniques introduites.

 

  • 10h15-10h45 : Pause

 

  • 10h45-11h30 : Charline Smadi
    Muller’s ratchet with binary tournament selection: Clickrates and type frequency profile

    Muller’s ratchet, in its prototype version, models a haploid, asexual population whose size is constant over the generations. Slightly deleterious mutations are acquired along the lineages at a constant rate, and individuals carrying less mutations have a selective advantage. In the classical variant, the individual fitness is proportional to the difference between the population average and the individual’s mutation load, whereas in the ‘tournament ratchet’ the individual fitness results as a sum of binary comparisons of the individual mutation loads. We obtain the asymptotic click rates of the tournament ratchet in a large parameter regime. We also analyse the type frequency profile of a sample drawn at a late time.
    This is based on an undergoing work, as well as on :
    – A. Gonzalez Casanova, C. Smadi, and A. Wakolbinger. Quasi-equilibria and click times for a variant of Muller’s ratchet. Electronic Journal of Probability, 2023.
    – J. Igelbrink, A. Gonzalez Casanova, C. Smadi, and A. Wakolbinger. Muller’s ratchet in a near-critical regime: Tournament versus fitness proportional selection. Theoretical Population Biology, 2024.
  • 11h30-12h15 : Aurélie Fischer :
    Apprentissage statistique en sciences du climat : exemple des ondes internes de gravité 

    Dans cet exposé, nous considérerons l’application de méthodes d’apprentissage statistique en sciences du climat : l’objectif est d’améliorer la connaissance et la description
    de processus physiques de petite échelle. Pour tenir compte des effets de ces processus de petite échelle, qui ne sont pas explicitement décrits dans les modèles de climat,
    il peut être utile d’intégrer, grâce à l’apprentissage statistique, les informations précises qui peuvent être fournies par des observations de ces processus. Les processus de petite
    échelle auxquels nous nous intéresserons sont les ondes internes de gravité, ondes dues au phénomène de gravité et à un contraste de densité sur la verticale. Les ondes de gravité
    jouent en effet un rôle crucial dans la circulation atmosphérique au-dessus de 15-20 km. Les observations dont nous disposons sont des mesures par ballons super pressurisés
    stratosphériques, obtenues dans le cadre de la campagne Stratéole 2, projet franco-américain du Centre national d’études spatiales. Le comportement quasi-Lagrangien des
    ballons permet d’accéder à des estimations précises de flux de quantité de mouvement associés aux ondes de gravité dans la basse stratosphère. Les variables explicatives décrivant
    l’écoulement à grande échelle sont quant à elles fournies par les données de réanalyse ERA5 provenant du Centre Européen pour les Prévisions Météorologiques à Moyen Terme.

 

 

Informations pratiques :

Les séminaires auront lieu dans le Bâtiment Fermat à l’UFR des Sciences de l’UVSQ.
Adresse : 45 avenue des États-Unis 78035 Versailles Cedex. Accès

 

 

Modélisation, analyse statistique, et applications en écologie et climatologie