Journée des thésards ESP

24 octobre 2017

Amphithéâtre Schwartz

9h30 - 10h00 Accueil (café)
10h00 - 12h00 Exposés
  • José Daniel Betancourt Reyes

  • Camille Champion

    Discovery of metagenomic biomarkers for the development of a diabete 2 related disease

    Dans le cadre de complications métaboliques de type hépatique liées à l’obésité et au diabète de type 2, l’environnement et notamment les conditions alimentaires sont des paramètres de forte influence. Des biologistes ont identifié que le microbiote intestinal permettait de faire le lien entre la nutrition et le développement de telles maladies. Dans ce contexte, l’enjeu de cette étude consiste à déterminer, parmi les paramètres environnementaux et bactériens, les biomarqueurs caractérisant l’évolution de la maladie. Cette information est essentielle pour classer les individus au sein d’une maladie et prédire son développement dans le but de soigner les patients et mettre en place de nouvelles solutions thérapeutiques personnalisées. Pour cela, une première étude statistique descriptive a été menée sur les deux types de jeux de données afin de visualiser l’ensemble des paramètres caractérisant les patients au cours du développement de la maladie. Une seconde étude, cette fois-ci discriminante a été réalisée sur les données bactériologiques dans le but de trouver des signatures d’un état pathologique donné. En dernier lieu, une nouvelle approche de normalisation provenant du text mining a été développée afin de détecter des biomarqueurs potentiels parmi les bactéries les moins présentes.

  • Valentin Debarnot

  • Paula Gordaliza

    Utilization of the Wasserstein distance in Statistical Learning

    In Statistical Learning, respecting the inner geometry of the data is a key issue in order to understand the information conveyed by them. Many recent works deal with this problem with many solutions such as local manifold embedding or the construction of suitable distances well adapted to the observations. It is important to use a distance which take into account the very nature of the observations and respect their structure. When dealing with distributions, the Monge-Kantorovich (a.k.a Wasserstein) distance has received a growing interest over the recent years. Looking for a way to measure structural relationships between data is of high importance. The distributions have to be compared while preserving their inner structure and, for this, Monge-Kantorovich distance is well suited. To study this issue, we will consider the optimal transportation general cost between the two empirical measures. The first task of this project will be to study the asymptotic behaviour of this quantity in the case where the two measures differ. We will establish deviation bounds and also derive a central limit theorem to study the asymptotic distribution of the empirical cost. We will deal with general dimension and general transportation cost, extending the preliminary existing work. Then these properties will be used for two main applications in Statistics: alignment of different signals observed in a warping process and fairness in Machine Learning.

  • Léonard Torossian

  • Mickael Albertus

    Asymptotics for the raking-ratio empirical process

    We study the empirical measure associated to a sample of size $n$ and modified by $N$ iterations of the so-called raking-ratio method. The empirical weights are adjusted at each iteration to exploit the knowledge of the true probability of sets in a finite partition which may change each step. We obtain asymptotic properties and Gaussian limits of the raking-ratio empirical process indexed by functions as $n\rightarrow +\infty$, for $N$ fixed then as $N\rightarrow +\infty $ slowly with $n$. This provides a closed-form expression of the limiting variances and covariances. Under some conditions they are everywhere less than for the initial empirical process. In particular, in the two-way contengency table case the raking-ratio empirical process converges to an explicit low variance Gaussian process as $n,N\rightarrow +\infty $.

  • Eyal Castiel

    Étude des algorithmes CSMA-QB, considérations qualitatives

    Pendant cette présentation, nous introduirons les planificateurs CSMA-Queue Based pour des files M/M/1 en parallèlle sous contraintes d’interférences. Les files sont situés sur les noeuds d’un graphe non orienté et deux files voisines ne peuvent être actives en même temps. Les CSMA utilisant la taille des files offrent un compromis entre l’algorithme Max-Weight, inutilisable en pratique car couteux en calculs, et les méthodes d’accès aléatoire fixe utilisées actuellement (norme 802.11 pour le wi-fi) qui ne s’adaptent pas aux besoins dynamiques des différentes files. On identifiera un régime de séparation d’échelle de temps entre les composantes du processus de Markov décrivant le système (le planificateur et la taille des files). On en déduira dans certains cas l’optimalité de la région de stabilité pour les taux d’arrivés.

12h00 - 13h30 Buffet
13h30 - 15h30 Exposés
  • Pierre Ménard

  • Fabien Montegut

    Limites d'échelle de marches aléatoires contraintes

    On considère une marche aléatoire sur Z^K conditionnée pour respecter une contrainte spécifique (pouvant être associée au comportement d'une chaîne de K prisonniers bourrés), et on s'intéresse au comportement asymptotique de cette chaîne, plus spécifiquement quand K tend vers l'infini.

  • William Oçafrain

    Quasi-stationarity with moving boundaries

    The goal will be to understand if we can extend quasi-stationarity (and all the other associated notions) considering moving absorbing boundaries. First of all, we will define the notions related with quasi-stationarity in the non-moving case which will be relevant for the lecture. Then some results of existence (or non existence) of these notions will be given in the case where the boundaries move periodically.

  • Aurore Archimbaud

    Distance de Mahalanobis et ICS pour la détection d’observations atypiques

    Dans cette présentation, nous nous intéressons à la détection non supervisée d’observations atypiques, au sein de données numériques multivariées. Nous considérons plus particulièrement le cas d’une faible proportion d’observations atypiques, comme par exemple dans la détection de fraudes ou de produits défectueux. La distance de Mahalanobis permet de calculer un score associé à chaque observation en prenant en compte la structure de covariances des données. Des scores élevés indiquent de potentiels atypiques. Nous montrons les limites de cette méthode dans le cas où la dimension augmente alors que la structure d’intérêt reste dans un espace de dimension fixe. La méthode ICS (Invariant Coordinate Selection) permet de pallier cet inconvénient en ne sélectionnant que des composantes pertinentes pour la détection d’atypiques. Les résultats seront illustrés sur des exemples simulés et sur des exemples réels à l’aide du package R ICSOutlier et de l’application ICSShiny que nous avons développés.

15h30 - 16h00 Pause (café)
16h00 - 17h00 Exposés
  • Hugo Bringuier

    Marches quantiques ouvertes

    Les marches quantiques ouvertes ont été introduites à l'origine par S. Attal, F. Petruccione, C. Sabot, and I. Sinayskiy en 2012, elles sont des généralisations quantiques des chaînes de Markov classiques. La première partie de cet exposé consiste à introduire les marches quantiques ouvertes, et plus précisement aux trajectoires quantiques associées. Ces trajectoires donnent lieu à des chaînes de Markov. La seconde partie de cet exposé portera sur la version continue de ces marches quantiques ouvertes, ce qui constitue le sujet de mes travaux actuels.

  • Guillermo Durand

    Tests multiples