Uhiversité de Toulouse

Philippe Besse

Professeur à l'INSA, Département de
Génie Mathématique et Modélisation
Institut de Mathématiques de Toulouse

WikiStat le Cours dont vous êtes le Héros

Toutes les ressources pédagogiques de cette page sont transférées sur le site WikiStat avec un format plus adapté à la consultation électronique. Les documents ci-dessous sont de simples compilations éventuellement moins à jour.
Nouveau

Big Data

Le déluge de données massives rend indispensable une adaptation rapide des ressources pédagogiques pour compléter la formation du Statisticien en Data Scientist. Les principaux mots clefs en sont Big data Analytics 1: Volumétrie, MapReduce pour Statisticien, la Non negative Matrix Factorization pour les systèmes de recommandation. Une introduction à Python pour statisticien, et le trafic de données massives (data munging) avec Python-pandas. Bientôt : MLlib de Spark/Hadoop avec Python.

Statistique et Big Data Mining

  • Statistique exploratoire multidimensionnelle (pdf)
  • Apprentissage statistique, data mining et modélisation (pdf)
  • Pratique de la modélisation statistique (pdf)
  • SAS 9.3 sous linux: Logiciel hermétique pour système ouvert (pdf)
  • Macros SAS
  • Jeux de données