Segmentation et indexation par locuteurs d'un document audio

Delacourt, Perrine
RJC 1999, Rencontre Jeunes Chercheurs, November 1999, Avignon, France

Mon travail de thèse consiste à segmenter et indexer par locuteurs des documents audio. En d'autres termes, il s'agit de reconnaître la séquence de locuteurs présents dans la conversation. Ce travail est réalisé avec les hypothèses suivantes : aucune connaissance a priori sur les locuteurs n'est disponible, le nombre de locuteurs est inconnu et les personnes ne parlent pas simultanèment. Notre système d'indexation se décompose en trois parties principales : la segmentation en locuteurs, le regroupement des segments appartenant à un même locuteur, la construction des modèles de locuteurs en ligne et l'utilisation de ces modèles pour le raffinement de la segmentation et la reconnaissance de la séquence de locuteurs.


Type:
Conférence
City:
Avignon
Date:
1999-11-01
Department:
Sécurité numérique
Eurecom Ref:
244
See also:

PERMALINK : https://www.eurecom.fr/publication/244