Regroupement de modèles de locuteurs par méthode Bayesienne variationnelle: applications à la sélection de modèles par méthode variationnelle pour l'indexation audio

Valente, Fabio;Wellekens, Christian J
t.a.l., Traitement Automatique des Langues, Volume 45, N°3, Octobre 2005, Numero spécial des meilleurs articles JEP-TALN 2004

Dans cet article, on étudie l?utilisation des méthodes variationnelles Bayesiennes pour le regroupement de locuteurs. Les méthodes variationnelles Bayesiennes (aussi connues sous le nom d?apprentissage d?ensemble) sont des méthodes approximées qui offrent un cadre totalement Bayesien pour l?apprentissage des modèles. Des techniques classiques telles que le Maximum a posteriori (MAP) ou la Vraisemblance maximale (ML) peuvent être considérées comme cas particuliers des méthodes variationnelles Bayesiennes (VB). En outre VB permet l?apprentissage simultané des paramètres et la sélection des modèles. Des expériences sur une tâche de regroupement de locuteurs pour les Nouvelles Radiodiffusées (Broadcast News) montrent que l?apprentissage variationnel Bayesien surclasse les méthodes classiques dans cette application. This paper aims at investigating the use of Variational Bayesian methods for speaker clustering purposes. Variational Bayesian methods (a.k.a. Ensemble learning) are approximated methods that allow a fully Bayesian framework for model learning. Classical techniques like Maximum a Posteriori (MAP) or Maximum Likelihood (ML) can be seen as special cases of VB methods. Furthermore VB allows parameter learning and model selection at the same time. Experiments on a speaker clustering task for Broadcast News show that Variational Bayesian Learning outperforms classical methods for this task.


Type:
Journal
Date:
2005-10-01
Department:
Digital Security
Eurecom Ref:
1693
Copyright:
© Hermes. Personal use of this material is permitted. The definitive version of this paper was published in t.a.l., Traitement Automatique des Langues, Volume 45, N°3, Octobre 2005, Numero spécial des meilleurs articles JEP-TALN 2004 and is available at :

PERMALINK : https://www.eurecom.fr/publication/1693