Introduction aux statistiques

IntroStat
Abstract

La statistique est à la base de nombreux domaines de la science et de l'ingénierie, car elle fournit une méthodologie systématique pour analyser les données. Ce cours présente les concepts fondamentaux de la statistique que l'on doit comprendre pour utiliser les méthodes statistiques dans la pratique. Ces concepts fourniront également des lignes directrices aux praticiens qui utilisent l'apprentissage automatique, car les statistiques constituent la base de l'apprentissage automatique.

Modalités pédagogiques Cours magistraux et devoirs maison.

Règles du cours : L'utilisation valide des méthodes statistiques nécessite une compréhension mathématique du mécanisme sous-jacent. En tant que tel, le cours couvre à la fois les aspects mathématiques et algorithmiques des statistiques.

Bibliography
  • Livre : EFRON B., HASTIE T. Computer Age Statistical Inference: Algorithms, Evidence and Data Science. Cambridge University Press, 2016, 493p.  (The textbook is freely available at the authors’ website: https://web.stanford.edu/~hastie/CASI/index.html)

  • Livre : BERGER J. Statistical Decision Theory and Bayesian Analysis. Springer, 1985, 618p.

Requirements

Le langage des statistiques est la théorie des probabilités. En tant que tel, le cours nécessite une connaissance de base des probabilités dans les résultats discrets finis, celle du calcul (comme la différenciation et l'intégration), et celle de l'algèbre linéaire (comme les vecteurs propres et les valeurs propres d'une matrice, et la solution d'équations linéaires).

Description

Le cours introduit les concepts fondamentaux de la statistique, tels que les estimateurs statistiques, la cohérence, le compromis biais-variance, l'estimation par maximum de vraisemblance, les tests d'hypothèse, l'estimation bayésienne et les tests d'hypothèse bayésiens.  Ces concepts seront expliqués d'une manière mathématiquement fondée sur des principes, en se concentrant sur les comportements des méthodes statistiques lorsque la taille des données augmente à l'infini.

Objectifs d'apprentissage : 

Les étudiants apprendront les notions fondamentales de la statistique et le mode de pensée statistique. Ces notions comprennent :

  • Les conclusions et les décisions qui peuvent être prises à partir de données dépendent fortement de la façon dont les données sont obtenues. Les concepts clés à cet égard sont le biais de sélection et la cohérence.
  • Il existe divers compromis dans les méthodes statistiques, notamment ceux entre

    • i) le biais
    • ii) la variance
    • iii) le calcul.

Cette connaissance est nécessaire dans la pratique, car elle est requise pour la sélection d'une méthode et d'un modèle ainsi que pour le réglage des hyperparamètres. Les concepts clés ici incluent l'erreur de généralisation, la validation croisée, la régularisation et la malédiction de la dimensionnalité.

Nb heures : 21 heures

Evaluation : 

  • Devoirs maisons (25% de la note finale)
  • Examen final (75% de la note finale)