Ecole d'ingénieur et centre de recherche en télécommunications

Siouar BENSAID

Siouar BENSAID
Siouar BENSAID
Eurecom - Communications Mobiles 
Doctorant ( 2009 - 2014)
Alumni EURECOM

Thèse

Quelques Contributions au Filtrage Optimal avec l'Estimation de Paramètres et Application à la Séparation de la Parole Mono-Capteur

Responsable(s)

 

Nous traitons le sujet de l’estimation conjointe des signaux aléatoires dépendant de paramètres déterministes et inconnus. En première partie, nous abordons le sujet du côté applicatif en proposant deux algorithmes itératifs de séparation de la parole voisée mono-capteur. Dans le premier algorithme, nous utilisons le modèle autorégressif de la parole qui décrit les corrélations court et long termes (quasi-périodique) pour formuler deux modèles d’Etat dépendant de paramètres inconnus linéairement et bilinéairement. EM-Kalman est ainsi utilisé pour estimer conjointement les sources et les paramètres. Nous dérivons trois variétés de cet algorithme. La première variété applique EM-Kalman sur le modèle linéaire en se limitant à un lissage à délai fixe (un délai de 1 échantillon), cette limitation est due à la singularité de la matrice de covariance d’erreur de prédiction. Les deux autres variétés consistent à appliquer EM-Kalman au modèle bilinéaire en utilisant le lissage RTS dans la première et le lissage à délai fixe (délai de 1 échantillon aussi) dans la deuxième.

Les simulations avec signaux synthétiques confirment la supériorité de la deuxième variété (modèle bilinéaire avec lissage RTS) sur le reste grâce à l’étape lissage RTS.

Les deux autres méthodes montrent des performances très proches. Avec les signaux réels, la méthode à base du modèle linéaire a montré des performances proches du modèle bilinéaire avec lissage RTS et mieux que celui avec lissage à délai fixe surtout en termes de SIR.

Dans le deuxième, nous proposons une méthode fréquentielle pour le même modèle de la parole utilisé avant mais cette fois nous estimons les sources et les paramètres séparément. Les observations sont découpées à l’aide d’un fenêtrage bien conçu pour assurer une reconstruction parfaite des sources après. Les paramètres (de l’enveloppe spectrale) sont estimés en maximisant le critère GML appliqué au spectre des données. Dans les méthodes asymptotiques qui utilisent des fenêtres infiniment longues, la matrice de covariance du spectre est modélisée par une matrice diagonale (spectre paramétrique en diagonal). Dans le cas d’une fenêtre à longueur finie, nous modélisons plus correctement la matrice de covariance du spectre en tenant compte de l’effet de ce fenêtrage qui introduit des corrélations entre les fréquences au voisinage du lobe principal de la fenêtre. Dans ce cas, la matrice de covariance devient une matrice bande. Après estimation des paramètres, le filtre de Wiener est utilisé pour estimer les sources par fenêtre. Finalement, les sources complètes sont reconstruites en utilisant la technique d’overlap-add.

En deuxième partie, nous abordons l’estimation conjointe d’un point de vue plus théorique en s’interrogeant sur les performances relatives de l’estimation conjointe par rapport à l’estimation séparée d’une manière générale. Nous considérons le cas conjointement Gaussien (observations et variables cachées) et trois méthodes itératives d’estimation conjointe: MAP en alternance avec ML, biaisé même asymptotiquement pour les paramètres, EM qui converge asymptotiquement vers ML et VB que nous prouvons converger asymptotiquement vers la solution ML pour les paramètres déterministes.

Rechercher



Informations additionnelles

soutenance envisagére en septembre 2013 - Siouar le 30/4/2013


Profils