Institut de Mathématiques de Toulouse

Accueil > Événements Scientifiques > Séminaires & Groupes de Travail > Groupes de Travail > GdT Mathématiques de l’apprentissage

Mathématiques de l’apprentissage

par Aurélien Garivier, Sébastien Gerchinovitz - publié le , mis à jour le

Ce groupe de travail hebdomadaire est dédié à l’étude mathématique des problèmes et des algorithmes de machine learning. Bien que rattaché à l’équipe-projet AOC qui réunit des membres de l’IMT et de l’IRIT, il est ouvert à toutes les personnes se sentant concernées par cette thématique sur le site toulousain, afin d’échanger des idées et de susciter des collaborations. Nous alternons entre exposés formels, séances de lecture, debriefings post-conférences, ou simples discussions.

* lieu : 1R3 - salle MIP si possible, sinon à voir selon disponibilités.
* fréquence : toutes les semaines le jeudi 12h30-13h30.




  • Jeudi 21 mars 2013 15:30-17:30 - Aurélien Garivier - IMT

    Problèmes de bandits stochastiques : borne inférieure de Lai et Robbins

    Résumé : Dans cet exposé, on se focalisera sur les problèmes d’allocations séquentielles dans un environnement stochastique (et non plus hostile, comme c’était le cas dans les deux exposés précédents).
    Pour ne pas bloquer les collègues de l’INSA (pris par une journée de recherche) pour la suite des séances, on se focalisera sur la borne inférieure de Lai et Robbins, qui stipule que l’espérance du regret subi par n’importe quelle politique "raisonnable" grandit au moins comme le logarithme de l’horizon, multiplié par une constante dépendant des paramètres que l’on s’efforcera d’interpréter.
    On verra au cours des séances suivantes quelles stratégies permettent d’atteindre ce regret optimal.

    Lieu : salle J. Cavaillès (132 1R2)


  • Jeudi 4 avril 2013 15:30-17:00 - Aurélien Garivier - IMT

    Bandits stochastiques : stratégies Upper Confidence Bounds

    Résumé : On présentera dans cette séances les stratégies Upper Confidence Bounds (UCB) : on commencera par la version classique de [Auer et al. ’02], avec la preuve de regret, et on montrera comment il faut modifier cet algorithme pour atteindre la borne inférieure de Lai et Robbins. A cette occasion, on introduira les outils statistiques nécessaires à la définition d’algorithmes de bandits avancés : auto-normalisation, et vraisemblance empirique.

    Lieu : salle J. Cavaillès (132 1R2)


  • Jeudi 18 avril 2013 15:30-17:30 - Sébastien Gerchinovitz - Université Paul Sabatier

    Problèmes de bandits multi-actions

    Résumé : Dans cet exposé, on va s’intéresser au cas où on doit choisir plusieurs actions simultanément dans un problème de bandits. On présentera l’article "Algorithms for Adversarial Bandit Problems with Multiple Plays" de Uchiya, Nakamura et Kudo (2010) disponible sur la page web du GdT :
    http://www.math.univ-toulouse.fr/ agarivie/gdtDeciSeq/

    Lieu : Salle J. Cavaillès (132 1R2)


  • Jeudi 23 mai 2013 15:30-17:00 - Sofiane Saadane - IMT

    Un algorithme de bandit pénalisé

    Résumé : Au cours de cet exposé, nous présenterons l’article de Lamberton et Pagès « a penalized bandit algorithm ». Le problème du bandit à deux bras est très connu des personnes fréquentant les casinos. En effet, un bandit est une machine comportant un bras que l’on actionne en espérant un gain. Le problème que l’on étudie est différent au sens où on a le choix entre deux bras A,B et à chaque étape on choisit d’actionner un des deux bras selon une certaine dynamique. Dans le cas que nous étudions deux traders A et B se partagent la gestion d’un fond géré par une personne Y. Tout les jours Y évalue le trader ayant la plus importante part à gérer et décide en fonction de l’évaluation d’augmenter ou de diminuer la part que gère ce trader. Après une présentation de l’algorithme, nous verrons que sous de faibles hypothèses il est infaillible (au sens où l’on finit toujours par choisir le meilleur bras). Ensuite il sera montré qu’en renormalisant l’algorithme convenablement celui-ci converge vers un processus de Markov particulier appelé PDMP (Piecewise Deterministic Markov Process). Une esquisse de preuve sera proposée pour établir cette convergence, on donnera la méthode plutôt qu’une preuve calculatoire. Enfin selon le temps et l’avancement de mon travail une étude du regret associé sera proposé. Cet exposé est différent des précédents, il a la particularité d’adopter un point de vue purement probabiliste qui contrastera avec l’aspect statistique des précédents.

    Lieu : Salle J. Cavaillès (132 bât.1R2)


  • Mercredi 19 juin 2013 14:00-15:00 - Sébastien Gadat

    Taux minimax dans des problèmes de régression et apprentissage séquentiel

    Résumé : On s’intéresse au problème de la régression non paramétrique sur [0,1]^d
    et l’aptitude des méthodes d’active learning à trouver des vitesses de
    reconstruction minimax dans ce contexte.
    Nous étudions essentiellement deux méthodes d’apprentissage actif : la
    méthode batch produit un design en amont des observations tandis que la
    stratégie d’apprentissage actif produit des designs séquentiellement au
    fur et à mesure que les observations arrivent.
    Nous démontrons alors que les stratégies "batch" ne peuvent pas
    améliorer les taux minimax de reconstruction dans les espaces de
    fonctions alpha lisses et alpha lisses par morceaux. Au contraire, des
    améliorations sont apportées par des méthodes d’apprentissage actif dans
    les espaces alpha lisses par morceaux lorsque le signal à reconstruire
    contient un certain nombre de discontinuités. Cette efficacité est
    quantifiée en fonction de la dimension d et de la régularité alpha.
    Références :
    * Alexander Korostelev, On minimax rates of convergence in image models under sequential design, Statistics & Probability Letters 43 (1999) 369 – 375
    * Rui Castro, Rebecca Willett and Robert Nowak, Faster Rates in Regression Via Active Learning, version longue de NIPS 2005

    Lieu : Bat 1R2, Salle 129 (Picard)


  • Mardi 25 juin 2013 15:30-17:30 - Sébastien Gadat - IMT

    Taux minimax dans des problèmes de régression et apprentissage séquentiel (2/2)

    Lieu : salle 106 (Bât 1R1)


  • Mercredi 5 février 2014 10:00-11:00 - Xavier Bressaud - IMT

    Jeux répétés markoviens avec défaut d’information asymétrique

    Résumé : Nous proposons une extension de résultats de Johannes Hörner, Dinah Rosenberg, Eilon Solan et Nicolas Vieille concernant la valeur et les stratégies optimales pour un jeu répété Markovien avec défaut d’information d’un coté introduit par Jérôme Renault. Elle est permise par l’étude du système dynamique (assez simple) représentant l’évolution de la croyance du joueur le moins bien informé sur l’état du jeu. (Travail avec Anthony Quas)

    Lieu : Bât 1R1 - salle 106


  • Jeudi 24 avril 2014 11:00-12:00 - Eric Sibony - Telecom ParisTech

    Multiresolution Analysis of Incomplete Rankings

    Résumé : Incomplete rankings on a set of items 1, …, n are orderings of the form a1 < … < ak, with a1, …, ak \subset 1, …, n and k < n. Though they arise in many modern applications, only a few methods have been introduced to manipulate them, most of them consisting in representing any incomplete ranking by the set of all its possible linear extensions on 1, …, n. In this talk, I will introduce a completely novel approach, which allows to treat incomplete rankings directly, representing them as injective words over 1, …, n. Unexpectedly, operations on incomplete rankings have very simple equivalents in this setting and the topological structure of the complex of injective words can be interpretated in a simple fashion from the perspective of ranking. We exploit this connection here and use recent results from algebraic topology to construct a multiresolution analysis and develop a wavelet framework for incomplete rankings. Though purely combinatorial, this construction relies on the same ideas underlying multiresolution analysis on a Euclidean space, and permits to localize the information related to rankings on each subset of items. It can be viewed as a crucial step toward nonlinear approximation of distributions of incomplete rankings and paves the way for many statistical applications, including preference data analysis and the design of recommender systems.

    Lieu : Bât 1R2, salle J. Cavailles (132)


  • Vendredi 17 octobre 2014 09:30-11:00 - Aurélien et Sébastien

    Problèmes de Décisions Séquentielles

    Résumé : Réunion de rentrée

    Lieu : salle MIP (1R3 premier étage)


  • 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9

  • Du 9 novembre 2015 09:00 au 10 novembre 2015 17:00 -

    Workshop CIMI "Sequential learning and applications"

    Résumé : The Institut de Mathématiques de Toulouse and the Institut de Recherche en Informatique de Toulouse are currently organizing a thematic trimester on machine learning at Université Paul Sabatier. This event is part of the LabEx CIMI.
    In this framework, a workshop on "Sequential learning and applications" will take place on November 9 and 10, 2015. Topics include online convex optimization and convex analysis, prediction with expert advice, multi-armed bandits, online combinatorial problems, recurrent neural networks, as well as recent applications for, e.g., recommender systems, information retrieval, and social media analysis.
    The registration to the workshop is free of charge but compulsory ; please visit our website.

    Lieu : Amphithéâtre Schwartz, bâtiment 1R3, Université Paul Sabatier.


  • Du 16 novembre 2015 09:30 au 17 novembre 2015 18:00 -

    Journées big data

    Résumé : Pour la troisième année consécutive, l’Université Paul Sabatier de Toulouse organise cet automne des rencontres sur les défis posés par les Big Data à la recherche en mathématique et en informatique, mais aussi à l’industrie.
    L’édition 2015 s’inscrit dans le cadre du trimestre thématique du Labex CIMI consacré au machine learning, et comportera deux volets :

    • le 16 novembre, une journée co-organisée par les GDR MADICS et MascotNUM du CNRS sur le calcul haute performance et les Big Data
    • le mardi 17 novembre, une journée de rencontre industrie-recherche présentant quelques grands défis et projets.

    Plus d’informations sur le site web.

    Lieu : 1R3-amphithéâtre Schwartz et U4-amphithéâtre Concorde, Université Paul Sabatier


iCal