Programme detaillé
JEUDI 4 avril
10h40-11h20 : Laure Sansonnnet Titre : Sélection de variables dans des modèles GLARMA 11h20-12h: Franck Picard Titre : PCA for Point Processes Résumé : Point processes constitute a common framework for modeling occurrences of events along space or time, with Poisson and Hawkes processes being fundamental examples. Statistical inference for point processes has been extensively studied, with nonparametric approaches and Bayesian methods being prominent. However, when many replicates of the process are available, exploratory methods are lacking to describe the heterogeneity or diversity of the observed patterns. Here, we introduce a new statistical perspective aiming to develop tools for dimension reduction and visualization of point processes, drawing inspiration from functional data analysis (FDA), particularly Principal Component Analysis (PCA) and functional PCA (fPCA). While classical PCA and fPCA do not directly apply to point processes, we develop a new framework to perform PCA on replicated point processes, based on Karhunen-Loève expansions of random measures. Our results include theoretical guarantees such as strong convergence of the KL decomposition, as well as a computational/visualization framework that allows us to unravel the variability of the observed point patterns. We illustrate our method on a wide variety of data, including earthquake data, neuroscience, and single-cell transcriptomics data. This work is a joint work with A. Roche, V. Rivoirard, and V. Panaretos. 12h-12h40 : Marie-Pierre Etienne Titre : Detecting genomic alteration in genomic profiles: the infinite population case 12h40-14h30 : Repas
14h30-15h10 : Clément Levrard
15h10-15h50 : Théo Lacombe Titre : Homogeneous Unbalanced Regularized Optimal Transport Résumé : Optimal transport (OT) is nowadays extremely popular in computational mathematics, thanks to its applications in machine learning. It has two natural extensions: entropy-regularized OT (ROT) and unbalanced OT (UOT), that have been mixed together by Séjourné et al., to derive an Unbalanced Regularized OT (UROT) problem. However, this problem may suffer from a caveat: it becomes non-homogeneous, a core property of either ROT or UOT. We propose an alternative where homogeneity is retrieved, while important properties of Séjourné's model are preserved, and discuss some applications in Topological Data Analysis. Refs : 15h50-16h20 : Pause café 16h20-17h : Jean Dufraiche Titre : Exploring Optimal Transport in Jazz Music Analysis. Application to the Real Book Résumé : Ce travail se penche sur l'analyse mathématique du Real Book, un célèbre corpus de musique de jazz. Pour simplifier le problème, nous supposons que chaque pièce musicale est exprimée comme une séquence d'accords. Notre approche introduit une représentation des accords basée sur leurs emprunts aux différents modes pythagoriciens, une dimension qui semble négligée dans la littérature existante. Cette représentation innovante permet d'établir des dissimilarités entre les accords, ce qui constitue la base de la comparaison des pièces. Plus précisément, deux pièces de Real Book peuvent être représentées par la distribution empirique de leurs accords. La dissimilarité entre ces pièces est alors déterminée par le coût de transport optimal entre leurs distributions respectives. Ce calcul repose sur le coût entre accords défini précédemment.
VENDREDI 5 avril 9h30-10h10 : Anouar Meynaoui
10h10-10h40 : Pause café 10h40-11h20 : Sunny Wang
11h20-12h : Linus Bleistein
12h-13h30 : Repas 13h30-14h10 : Fabienne Comte
Résumé : We consider N i.i.d. one-dimensional inhomogeneous diffusion processes (Xi(t), i=1, …, N) with drift mu(t,x)= a1(t) g1(x)+ … + aK(t)gK(x) and diffusion coefficient sigma(t,x), where K, the functions gj(x) and sigma(t,x) are known. Our concern is the nonparametric estimation of the K-dimensional unknown function (aj(t), j=1, … , K) from the continuous observation of the N sample paths (Xi(t)) throughout a fixed time interval [0,T]. A collection of projection estimators belonging to a product of finite-dimensional subspaces of L2([0,T]) is built. The L2-risk is defined by the expectation of either an empirical norm or a deterministic norm fitted to the problem. Rates of convergence for large N are discussed. A data-driven choice of the dimensions of the projection spaces is proposed. The theoretical results are illustrated by numerical experiments on simulated data. Titre : Repelled point processes with application to numerical integration Résumé : Linear statistics of point processes yield Monte Carlo estimators of integrals. While the simplest approach relies on a homogeneous Poisson point process (PPP), more regularly spread point processes yield estimators with fast-decaying variance. Following the intuition that more regular configurations result in lower integration error, in this presentation we introduce the repulsion operator, which reduces clustering by slightly pushing the points of a configuration away from each other. Our empirical findings show that applying the repulsion operator to a PPP and, intriguingly, to regular point processes reduces the variance of the corresponding Monte Carlo method and thus enhances the method. This variance reduction phenomenon is substantiated by our theoretical result when the initial point process is a PPP. On the computational side, the complexity of the operator is quadratic and the corresponding algorithm can be parallelized without communication across tasks. Preprint : https://arxiv.org/abs/2308.04825 Code : https://github.com/dhawat/MCRPPy Website: https://dhawat.github.io/ 14h50-15h20 : Pause café 15h20-16h : Lisa Balsollier Titre : Analyse du mouvement des trajectoires d’un processus birth-death-mutation-move et détection des instants de changement de régime grâce aux modèles de Markov à états cachés et à un algorithme EM. Résumé : Ma thèse se concentre sur un processus, appelé processus birth-death-move avec mutations permettant de modéliser la dynamique d’un système de particules qui se déplacent au fil du temps, tandis que de nouvelles particules peuvent apparaître et que certaines particules existantes peuvent disparaître. Dans ce modèle, les trajectoires peuvent être générées par n’importe quel modèle de diffusion de Markov continu, et peuvent changer de mouvement au cours de leur durée de vie. Après avoir présenté rapidement ce modèle, je m’attarderai sur l'analyse du type de régime suivi par chaque trajectoire et sur la détection des instants de changement de régime. Je m'appuierai sur un exemple, dans lequel les trajectoires peuvent suivre trois modèles de diffusion possibles : un mouvement brownien, un mouvement dirigé (qui est souvent un mouvement brownien dirigé), et un mouvement confiné (qui peut, par exemple, être modélisé par un processus d’Ornstein-Uhlenbeck). L'objectif est de déterminer les paramètres caractérisant ces trois types de mouvements, ainsi que d'identifier les moments où une particule passe d'un régime de mouvement à un autre. Pour cela, j'utiliserai un algorithme de type Expectation-Maximization (EM) conjointement avec un modèle de Markov à états cachés.
|
Personnes connectées : 2 | Vie privée |