Aspects algorithmiques de l'apprentissage automatique

AML
Abstract

Ce cours vise à fournir une base algorithmique solide et pratique pour la conception et l'utilisation d'algorithmes d'apprentissage, avec un accent particulier sur le modèle de programmation MapReduce. L'objectif est de se familiariser avec un large éventail de sujets, à travers l'application des idées théoriques sur des problèmes d'intérêt pratique. Ceci est une « classe inverse », dans laquelle les étudiants travailleront à la maison pour apprendre ou réviser les concepts théoriques, pour ensuite appliquer ce qu'ils ont appris à la solution de problèmes du monde réel, y compris des applications industrielles, au cours de nombreuses séances de travaux pratiques. Les sessions de travaux pratiques seront basées sur des technologies modernes telles que les Notebooks Jupyter. 

Modalités pédagogiques : Sessions de travaux pratiques (groupes de 2 étudiants).

Règles du Cours : La participation aux séances de travaux pratiques est obligatoire.

Bibliography
  • Livre : JAMES G., WITTEN D., HASTIE T., TIBSHIRANI R. An Introduction to Statistical Learning. Springer, 2013, 440p.

  • Livre : BISHOP C. Pattern Recognition and Machine Learning. Springer-Verlag, 2006, 768p.

  • Livre : RYZA S., LASERSON U., OWENS S., WILLS J. Advanced Analytics with Spark. O’Reilly, 2017, 280p.

  • Livre : SHALEV-SHWARTZ S., BEN-DAVID S. Understanding Machine Learning: From Theory to Algorithms. Cambridge University Press, 2014, 410p.

  • Livre : LESKOVEC J. (Stanford University), RAJARAMAN A. (Milliways Laboratories), ULLMAN J.D. (Stanford University). Mining of Massive Datasets. Cambridge University Press, 2014, 476p.

Requirements

Les prérequis sont les cours « Apprentissage Automatique & Systèmes Intelligents » (MALIS), « Systèmes Distribués & Cloud Computing » (CLOUDS) et « Techniques Avancées d’Inférence Statistique » (ASI).

Description
  • Introduction et rappels sur Apache Spark
  • Notebook : Exercices de prise en main pour Python and Apache
  • Notebook : Systèmes de recommandation, appliqués à l'industrie de la musique
  • Notebook : Régression avec les arbres de décision et les forets aléatoires, appliqués à l'industrie du voyage
  • Notebook : Méthodes Monte-Carlo, applique à l'analyse du risque financier
  • Notebook : Détection d'anomalies, appliqués à l'industrie des télécom
  • Notebook : Analyse de séries temporelles, appliqués à l'imagerie médicale
  • Notebook : Applications industrielles

Objectifs d'apprentissage :

  • Comprendre les problèmes de data science, identification des outils et des algorithmes pour leur solution
  • Conception et implémentions « but-en-but » d'outils logiciels pour analyser et préparer des donnés, pour apprendre un modelé statistique, et pour l'utiliser pour faire des prédictions
  • Validation de la qualité d'outils logiciels pour l'apprentissage et la solution de problèmes de data science

Nb heures : 21 heures

Evaluation : Rapports de travaux pratiques (100% de la note finale).