Ecole d'ingénieur et centre de recherche en télécommunications

Miriam REDI

Miriam REDI
Miriam REDI
Eurecom - Communications Multimédia 
Doctorant ( 2010 - 2013)
Alumni EURECOM

Thèse

Nouvelles méthodes pour la recherche sémantique et esthétique d?informations multimédia

Responsable(s)

 

 Comment les ordinateurs peuvent-ils comprendre la signification et la beauté d'une image?
A l'ère d'Internet, la classification informatisée des images est d'une importance cruciale pour l’utilisation efficace de l'énorme quantité de données visuelles qui sont disponibles. La Recherche d’Information Multimédia (RIM) est un domaine de recherche qui vise à construire des systèmes capables de reconnaître automatiquement le contenu d’une image.
D'abord, des caractéristiques de bas niveau sont extraites et regroupées en signatures visuelles compactes. Ensuite, des techniques d'apprentissage automatique construisent des modèles qui font la distinction entre les différentes catégories d'images à partir de ces signatures. Ces modèles sont finalement utilisés pour reconnaître les propriétés d'une nouvelle image.
Malgré les progrès dans le domaine, ces systèmes ont des performances en général limitées. Dans cette thèse, nous concevons un ensemble de contributions originales pour chaque étape de la chaîne RIM, en explorant des techniques provenant d'une variété de domaines qui ne sont pas traditionnellement liés avec la Recherche d’Information Multimédia.
Par exemple, nous empruntons la notion de saillance et l'utilisons pour construire des caractéristiques de bas niveau. Nous employons la théorie des Copulae étudiée en statistique économique, pour l'agrégation des caractéristiques. Nous réutilisons la notion de pertinence graduée, populaire dans le classement des pages Web, pour la récupération visuelle. Nous explorons la synergie de l’analyse sémantique, l’analyse photographique, l’analyse émotionnelle, l’analyse artistique pour étudier le niveau esthétique de l’image.
Le manuscrit détaille nos solutions novatrices et montre leur efficacité pour la catégorisation d'image et de vidéo, et l’évaluation de l'esthétique.