A corpus-based approach to video indexing for TV news

Mérialdo, Bernard
RFIA 1998, 11ème Congrès Reconnaissance des Formes et Intelligence Artificielle, 20-22 janvier 1998, Clermont-Ferrand, France

L'indexation vidéo est un élément essentiel pour l'accès aux documents multimédia par le contenu. Dans cet article, nous proposons une méthodologie d'indexation basée sur la construction et l'utilisation de corpus de vidéo annotée, à la fois pour l'apprentissage et pour l'évaluation des techniques mises en oeuvre. Nous commentons rapidement les avantages et inconvénients d'une telle approche, puis nous décrivons comment nous l'avons utilisée pour une application d'indexation. Nous décrivons un ensemble d'Outils d'Annotation de Vidéo qui facilite la construction de telles bases de données. Nous proposons également un format unique pour stocker les informations d'annotation. Puis nous présentons comment ces données sont utilisées pour l'analyse automatique d'enregistrements de Journaux Télévisés, suivant une approche proposée par Smoliar and Zhang. Nous proposons des améliorations de certaines étapes, par exemple pour la détection de personnes, nous utilisons un arbre de décision qui est construit automatiquement à partir d'exemples. Enfin, nous montrons comment le résultat de l'analyse peut servir à construire un interface utilisateur qui permet un accès hypermédia au contenu de ces enregistrements.


Type:
Conférence
City:
Clermont-Ferrand
Date:
1998-01-01
Department:
Data Science
Eurecom Ref:
161
Copyright:
© Hermes. Personal use of this material is permitted. The definitive version of this paper was published in RFIA 1998, 11ème Congrès Reconnaissance des Formes et Intelligence Artificielle, 20-22 janvier 1998, Clermont-Ferrand, France and is available at :

PERMALINK : https://www.eurecom.fr/publication/161