Ecole d'ingénieur et centre de recherche en Sciences du numérique
 

Aspects algorithmiques de l'apprentissage automatique

[AML]
T Enseignement Technique


Résumé

Ce cours vise à fournir une base algorithmique solide et pratique pour la conception et l'utilisation d'algorithmes d'apprentissage, avec un accent particulier sur le modèle de programmation MapReduce. L'objectif est de se familiariser avec un large éventail de sujets, à travers l'application des idées théoriques sur des problèmes d'intérêt pratique. Ceci est une « classe inverse », dans laquelle les étudiants travailleront à la maison pour apprendre ou réviser les concepts théoriques, pour en suite appliquer ce qu'ils ont appris à la solution de problèmes du monde réel, y compris des applications industrielles, au cours de nombreuses séances de laboratoire. Les sessions de laboratoire seront basées sur des technologies modernes telles que les Notebooks Jupyter.

 Méthodes d'enseignement et d'apprentissage :  Sessions de laboratoire (groupes de 2 étudiants) 

Règles du Cours : La participation aux laboratoires est obligatoire.

Bibliographie

  • An Introduction to Statistical Learning, by Gareth James, et. al.
  • Pattern recognition and Machine Learning, by C. Bishop, Springer
  • Advanced Analytics with Spark, by Sandy Ryza, et. al.
  • Understanding Machine Learning: From Theory to Algorithms, by Shai Shalev-Shwartz et. al.
  • Mining of Massive Datasets, Jure Leskovec (Stanford University), Anand Rajaraman (Milliways Laboratories), Jeffrey David Ullman (Stanford University), Cambridge University

Préalable Requis

Les prérequis pour ce cours sont les cours MALIS (FALL), CLOUDS (FALL) et ASI (SPRING)

Description

  • Introduction et rappels sur Apache Spark
  • Notebook : Exercices de prise en main pour Python and Apache
  • Notebook : Systèmes de recommandation, appliqués à l'industrie de la musique
  • Notebook : Régression avec les arbres de décision et les forets aléatoires, appliqués à l'industrie du voyage
  • Notebook : Méthodes Monte-Carlo, applique à l'analyse du risque financier
  • Notebook : Détection d'anomalies, appliqués à l'industrie des télécom
  • Notebook : Analyse de séries temporelles, appliqués à l'imagerie médicale
  • Notebook : Applications industrielles

Résultats d'apprentissage :

  • Comprendre les problèmes de data science, identification des outils et des algorithmes pour leur solution
  • Conception et implémentions « but-en-but » d'outils logiciels pour analyser et préparer des donnés, pour apprendre un modelé statistique, et pour l'utiliser pour faire des prédictions
  • Validation de la qualité d'outils logiciels pour l'apprentissage et la solution de problèmes de data science

Nb heures : 21

Evaluation : Notebooks

Nombre d'heures: 21.00
Nombre d'heures par semaine: 3.00