Ecole d'ingénieur et centre de recherche en télécommunications

Mario PASTORELLI

Mario PASTORELLI
Mario PASTORELLI
Eurecom - Réseaux et Sécurité 
Doctorant
04 93 00 81 23
04 93 00 82 00
369

Thèse

Disciplines basées sur la taille pour la planification des jobs dans data-intensif scalable computing systems

Responsable(s)

 

La dernière décennie a vu l'émergence de systèmes parallèles pour l'analyse de grosses quantités de données (DISC) , tels que Hadoop, et la demande qui en résulte pour les politiques de gestion des ressources, pouvant fournir des temps de réponse rapides ainsi qu'équité. Actuellement, les schedulers pour les systèmes de DISC sont axées sur l'équité, sans optimiser les temps de réponse. Les meilleures pratiques pour surmonter ce problème comprennent une intervention manuelle et une politique de planification ad-hoc , qui est sujette aux erreurs et qui est difficile à adapter aux changements.

Dans cette thèse, nous nous concentrons sur la planification basée sur la taille pour les systèmes DISC. La principale contribution de ce travail est le scheduler dit Hadoop Fair Sojourn Protocol (HFSP), un ordonnanceur préemptif basé sur la taille qui tient en considération le vieillissement, ayant comme objectifs de fournir l'équité et des temps de réponse réduits.

Hélas, dans les systèmes DISC, les tailles des job d'analyse de données ne sont pas connus a priori, donc, HFSP comprends un module d'estimation de taille, qui calcule une approximation et qui affine cette estimation au fur et à mesure du progrès d'un job.

Nous démontrons que l'impact des erreurs d'estimation sur les politiques fondées sur la taille n'est pas significatif. Pour cette raison, et en vertu d'être conçu autour de l'idée de travailler avec des tailles estimées, HFSP est tolérant aux erreurs d'estimation de la taille des jobs. Nos résultats expérimentaux démontrent que, dans un véritable déploiement Hadoop avec des charges de travail réalistes, HFSP est plus performant que les politiques de scheduling existantes, à la fois en terme de temps de réponse et d'équité. En outre, HFSP maintiens ses bonnes performances même lorsque le cluster de calcul est lourdement chargé, car il focalises les ressources sur des jobs ayant priorité.

HFSP est une politique préventive: la préemption dans un système DISC peut être mis en œuvre avec des techniques différentes. Les approches actuellement disponibles dans Hadoop ont des lacunes qui ont une incidence sur les performances du système. Par conséquence, nous avons mis en œuvre une nouvelle technique de préemption, appelé suspension, qui exploite le système d'exploitation pour effectuer la préemption d'une manière qui garantit une faible latence sans pénaliser l'avancement des jobs a faible priorité.