Ecole d'ingénieur et centre de recherche en Sciences du numérique

Systèmes distribués Cloud Computing

[Clouds]
T Enseignement Technique


Résumé

Le but de ce cours est de fournir une vue d'ensemble sur les sujets et les tendances récentes dans le domaine des systèmes distribués et du « cloud computing ». Nous discuterons des techniques logiciels utilisées pour la conception et la programmation des systèmes fiables, pouvant passer à l'échelle. Nous aborderons également la conception d'architecture des centres de données modernes et les techniques de virtualisation qui constituent un thème central du paradigme de «cloud computing». Le cours est complété par un nombre de séances de laboratoire pour obtenir une expérience pratique avec Hadoop et la conception des algorithmes avec MapReduce.

Méthodes d'enseignement et d'apprentissage : Cours et Travaux pratiques (groupes de 2 étudiants) 

Règles du Cours : La participation aux travaux pratiques est obligatoire.

Bibliographie

  • Learning Spark, by Holden Karau, Andy Konwinski, Patrick Wendell and Matei Zaharia, O'Reilly
  • Data-intensive Text Processing with MapReduce, by Jimmy Lin and Chris Dyer
  • Hadoop, The Definitive Guide, by Tom White
  • Hadoop Operations, by Eric Sammer
  • HBase, The Definitive Guide, by Lars George

Préalable Requis

Connaissance des structures de donnes, de la conception d'algorithmes et leur analyse. Familiarité avec Java et au moins un autre langage de programmation (python, scala).

Description

  • Introduction
  • Conception d'algorithmes pouvant passer à l'échelle
  • Architecture d'Apache Hadoop
  • Architecture d'Apache Spark
  • Ordonnanceurs pour cluster et datacenter
  • Algèbre Relationnelle
  • Apache Pig et Pig Latin
  • Systèmes de stockage distribués
  • Coordination des systèmes distribués avec Apache Zookeeper
  • Sélection de sujets dans le domaine du Cloud Computing

Résultats d'apprentissage :

  • Comprendre, identifier et utiliser les architectures de systèmes distribués
  • Conception et implémentation d'algorithmes distribués pouvant passer a l'échelle
  • Comprendre et utiliser les systèmes de stockage distribués

Nb heures : 42.00, au moins 5 TP (15 heures)

Evaluation  : Travaux Pratiques (50%), Examen final écrit (50%)

Nombre d'heures: 42.00
Nombre d'heures par semaine: 3.00