Contenus
Méthodes statistiques et Data Mining
- Statistique exploratoire multidimensionnelle
:
description elementaire, analyse en composantes principales, analyse factorielle discriminante, analyse des correspondances simple et multiple, positionnement multidimensionnel, classification, rappels d'algèbre linéaire.
- Modélisation statistique et apprentissage
:
Modélisation statistique et modèle linéaire général, choix de modèle, régression logistique, analyse discriminante, estimation de l'erreur de prédiction, bootstrap, validation croisée, arbres binaires de décision (CART), réseau de neurones, agrégation de modèles (bagging, boosting, random forest), support vector machine.
- Pratique de la modélisation statistique
:
Régression linéaire simple et multiple, analyse de variance et covariance, modèles de dénombrement (logistique et log-linéaire), introduction au modèle linéaire général.
Méthodes statistiques pour les données post-génomiques 
- Analyse statistique des données transcriptomiques
:
Les techniques statistiques précédentes sont adaptées et mise en oeuvre dans le cadre très spécifique de l'étude des données transcriptomiques (biopuces ou microarrays).
Logiciels de Statistique 
Introduction à R
Introduction à SAS
- SAS sous Unix: Logiciel hermétique pour système ouvert
:
Gestion des données, procédures élémentaires, graphiques haute résolution (SAS/GRAPH), exploration graphique (SAS/INSIGHT), techniques factorielles (SAS/STAT, modélisation (SAS/STAT), prévision (SAS/ETS), classification (SAS/STAT), planification, macro-commandes, SAS Enterprise Miner (SEM).
- Quelques macros-commandes SAS
Travaux pratiques 
|