STA301 Analyse de données de grande dimension

Informations

Langue d'enseignement : Français
Crédits ECTS: 3

Programme

  • Heures d'enseignement dispensées à l'étudiant : 30 heures
  • Temps de travail personnel : 45 heures

Objectifs et compétences

Objectifs :
Présenter différentes méthodes statistique pouvant s'appliquer à des données de grande dimension où le nombre de variables explicatives dépasse largement le nombre d'individus. L’étudiant à l’issue de cet enseignement doit maîtriser des méthodes de réduction de dimension (PLS, sparse-PLS), de pénalisation (Lasso), ainsi que des méthodes non-paramétriques (CART, Forêts aléatoires). Un accent est mis sur les problématiques de prédiction (du statut de nouveaux individus par exemple) et de sélection de variables.

Compétences :
  • Travailler en équipe dans différents contextes, y compris avec des personnes issues de disciplines différentes : s'intégrer, se positionner, collaborer, communiquer et rendre compte.

  • Analyser et synthétiser des données en vue de leur exploitation
  • Savoir communiquer

  • Décrire et visualiser des données., manipuler des bases de données
  • Mettre en œuvre une analyse statistique standard, interpréter les résultats, identifier et évaluer les hypothèses sous-jacentes à la méthode utilisée
  • Rechercher, comprendre et appliquer de nouvelles méthodes statistiques
  • Maitriser au moins un logiciel statistique standard (SAS ou R par exemple) et être capable de comprendre et modifier un programme écrit dans un langage de programmation statistique standard (SAS et/ou R)

Organisation pédagogique

le mode de fonctionnement de l'UE est présenté au début des enseignements

Contrôle des connaissances

Contrôle continu

Lectures recommandées

l'ensemble des références bibliographiques est communiqué au début des enseignements

Responsable de l'unité d'enseignement

Robin Genuer

Enseignants

la composition de l'ensemble de l'équipe pédagogique est communiquée au début des enseignements