Ce cours est une introduction au traitement automatique de la parole et des signaux audio. Il débute avec une analyse du fonctionnement de la parole chez l’humain et des mécanismes de perception, et se penche sur l’impact de notre compréhension de ces éléments sur la manière de conduire l’analyse automatique de la parole et des signaux audio. Le cours abordera ensuite l’analyse, le codage et la paramétrisation des signaux dans plusieurs cas de traitements. Après une introduction sur les fondements en reconnaissance de formes, plusieurs applications spécifiques seront considérées dans ce cours incluant la reconnaissance de parole, reconnaissance et localisation du ou des locuteur,(s). Le cous inclut aussi des notions en traitement de la parole, codage audio, réduction de bruit et amélioration de la qualité des signaux de parole.
Modalités pédagogiques : Le cours inclut des séances de cours magistraux, de travaux pratiques et de travaux dirigés.
Règles du cours : La présence aux séances de travaux pratiques (TPs) est obligatoire.
- Livre : HUANG X., ACERO A., HON H-W. Spoken language processing: a guide to theory, algorithms, and system development. Prentice Hall, 2001, 1008p.
- Livre : RABINER L., JUANG B-H. Fundamentals of speech recognition. Pearson College Div, 1993, 496p.
- Livre : SIMPSON P. La conception de systèmes avec FPGA. Dunod, 2014, 304p. (en français)
Connaissances de base en mathématiques de l’ingénieur, traitement du signal, statistiques et probabilités.
- Production, perception et analyse
- Éléments de modélisation, classification et reconnaissance
- Approches déterministes en reconnaissance de la parole
- Approches stochastiques en reconnaissance de la parole
- Reconnaissance et localisation du locuteur
- Codage audio
- Réduction de bruit et amélioration des signaux de parole
Objectifs d’apprentissage :
- Familiariser les étudiants avec les mécanismes de formation et perception de la parole chez les humains, les outils de base en traitement automatique des signaux audio et les techniques les plus significatives en reconnaissances de formes ;
- Savoir appliquer ces techniques aux traitement automatique de la parole et des signaux audio ;
- Implanter, analyser et évaluer les performances des outils et techniques étudiés dans divers domaines du traitement de la parole et des signaux audio.
Nb heures : 21 heures
Evaluation :
-
Rapports des travaux pratiques (ne compte pas dans la note finale),
-
Examen final (100% de la note finale)