Traitement de la parole et de l'audio

Speech

Abstract

Ce cours est une introduction au traitement automatique de la parole et des signaux audio. Il débute avec une analyse du fonctionnement de la parole chez l’humain et des mécanismes de perception, et se penche sur l’impact de notre compréhension de ces éléments sur la manière de conduire l’analyse automatique de la parole et des signaux audio. Le cours abordera ensuite l’analyse, le codage et la paramétrisation des signaux dans plusieurs cas de traitements. Après une introduction sur les fondements en reconnaissance de formes, plusieurs applications spécifiques seront considérées dans ce cours incluant la reconnaissance de parole, reconnaissance et localisation du ou des locuteur,(s). Le cous inclut aussi des notions en traitement de la parole, codage audio, réduction de bruit et amélioration de la qualité des signaux de parole.

Modalités pédagogiques : Le cours inclut des séances de cours magistraux, de travaux pratiques et de travaux dirigés.

Règles du cours : La présence aux séances de travaux pratiques (TPs) est obligatoire.

Bibliography

Livre : HUANG X., ACERO A., HON H-W. Spoken language processing: a guide to theory, algorithms, and system development. Prentice Hall, 2001, 1008p.
Livre : RABINER L., JUANG B-H. Fundamentals of speech recognition. Pearson College Div, 1993, 496p.
Livre : SIMPSON P. La conception de systèmes avec FPGA. Dunod, 2014, 304p. (en français)

Requirements

Connaissances de base en mathématiques de l’ingénieur, traitement du signal, statistiques et probabilités.

Description

Production, perception et analyse
Éléments de modélisation, classification et reconnaissance
Approches déterministes en reconnaissance de la parole
Approches stochastiques en reconnaissance de la parole
Reconnaissance et localisation du locuteur
Codage audio
Réduction de bruit et amélioration des signaux de parole

Objectifs d’apprentissage :

Familiariser les étudiants avec les mécanismes de formation et perception de la parole chez les humains, les outils de base en traitement automatique des signaux audio et les techniques les plus significatives en reconnaissances de formes ;
Savoir appliquer ces techniques aux traitement automatique de la parole et des signaux audio ;
Implanter, analyser et évaluer les performances des outils et techniques étudiés dans divers domaines du traitement de la parole et des signaux audio.

Nb heures : 21 heures

Evaluation :

Rapports des travaux pratiques (ne compte pas dans la note finale),
Examen final (100% de la note finale)