Ecole d'ingénieur et centre de recherche en télécommunications

José Luis REDONDO GARCIA

José Luis REDONDO GARCIA
José Luis REDONDO GARCIA
Eurecom - Data Science 
Doctorant ( 2012 - 2016)
Alumni EURECOM

Thèse

Annotation Sémantique et Contextualisation des Actualités Vidéos sur le Web

Responsable(s)

Le contenu multimédia est l'un des moyens les plus largement et naturellement utilisés pour consommer de l'information. Le contenu vidéo est désormais roi sur le Web, avec des centaines de milliers d'heures de contenu déversés tous les jours sur des plateformes sociales telles que YouTube. Mais, est-il possible de représenter ce contenu vidéo et ses métadonnées de telle une manière qu'il soit plus facilement trouvable et ré-utilisable non seulement comme vidéo entière mais également à différents niveaux de granularité ? Est-ce que l'information contenue dans ces vidéos est suffisamment contextualisée et formalisée pour être consommée tant pas des humains que des machines ?

 

Dans cette thèse, nous étudions comment tirer partie au mieux des standards disponibles, tels que la spécification Media Fragments URI et de techniques d'annotation avancées pour faire du contenu multimédia un objet de première classe sur le Web. Nous préconisons l'utilisation des technologies sémantiques comme un moyen de permettre aux machines d'effectuer automatiquement ces tâches. Nous présentons plusieurs approches basées sur la recherche d'information et la représentation des connaissances pour combler l'écart entre les caractéristiques visuelles de bas niveau pouvant être obtenues par des techniques d'analyse traditionnelles, et les concepts de plus haut niveau qui correspondent aux besoin des utilisateurs. Aligner ces concepts à des vocabulaires normalisés pour un domaine donné permet aux machines d'interpréter et de raisonner sur les informations disponibles dans ces documents afin d'offrir des services innovants pour la navigation, l'enrichissement et l'interconnection des Media Fragments, et, au final, d'améliorer la façon dont l'information multimédia est consommée.

 

L'absence de contexte qu'un unique document multimédia peut fournir est un frein pour bien comprendre l'histoire qui est rapportée. Les articles de presse internationales sont un bon exemple de ce phénomène. Par conséquent, il est nécessaire de révéler tous les aspects de l'histoire qui, même s'ils ne sont pas explicitement présents dans le document de base, sont essentiels pour capturer la trame de fond. Pour faire face à ce problème, nous proposons un modèle conceptuel innovant appelé News Semantic Snapshot (NSS) qui est conçu pour rendre explicite le contexte de l'événement d'une dépêche d'actualité. Suite à un processus appelé Named Entity Expansion, nous interrogeons le Web pour apporter d'autres points de vue sur ce qui se passe autour de nous, des milliers d'articles de presse et de messages où nous pourrions potentiellement trouver des détails de l'histoire. Nous avons également proposé une approche innovante concentrique afin de mieux répérer les entités contextuelles en misant sur la dualité entre le "Core", qui contient des entités représentatives fréquemment mentionnées dans les documents connexes, et celles qui détiennent des relations sémantiques particulières avec ce "Core" et façonnent des couches autour de lui: le "Crust".