Construction automatique de résumés vidéos

Yahiaoui, Itheri
Thesis

La croissance rapide des documents multimédia, comme par exemple l'énorme flux de vidéos qui se trouvent sur les ordinateurs personnels et autres équipements, nécessite le développement de nombreux outils pour leur manipulation. La création automatique de résumés vidéos est un outil performant qui permet de résumer le contenu général de la vidéo et de présenter les parties les plus pertinentes. A travers cette thèse, nous proposons une nouvelle approche de construction et d'évaluation automatique de résumés vidéos. Cette approche est basée sur un principe que nous proposons et que nous dénommons «Principe de Reconnaissance Maximale». Ce dernier est dérivé d'une tâche réaliste prédéfinie qui consiste à l'identification de l'origine d'un extrait donné ayant uniquement connaissance d'un résumé. Notre méthode de construction est un processus d'optimisation, par rapport au Principe de Reconnaissance Maximale PRM, qui permet de construire le meilleur résumé possible qui sera dédié à aider l'utilisateur dans l'accomplissement de cette tâche d'identification. Le meilleur résumé est celui qui maximise le nombre de réponses correctes données par l'utilisateur. Ces approches peuvent être utilisées pour la création de résumés de différents types de média. Au cours de cette thèse, nous avons adopté ce PRM pour proposer différentes méthodes de création de résumés selon le ou les média pris en considération. En premier lieu, nous avons présenté une première méthode de construction de résumés vidéos en utilisant uniquement les informations visuelles, puis nous avons étudié différentes méthodes de construction multi-vidéos. Ensuite, nous avons illustré l'adaptation de ce principe pour la construction de résumés basés exclusivement sur les informations textuelles. Enfin, nous avons proposé une méthode de construction de résumés vidéo-textuels en combinant conjointement lors du processus d'optimisation les informations visuelles et textuelles.


Type:
Thesis
Date:
2003-10-20
Department:
Data Science
Eurecom Ref:
1256
Copyright:
© ENST Paris. Personal use of this material is permitted. The definitive version of this paper was published in Thesis and is available at :
See also:

PERMALINK : https://www.eurecom.fr/publication/1256