Traitement du signal audio dans le domaine codé : techniques et applications.

Benjelloun Touimi, Abdellatif
Thesis

La manipulation classique de flux audio codés nécessite une opération préalable de décodage pour extraire les signaux temporels puis de recodage après traitement. Cette approche directe présente des inconvénients en terme de complexité et délai algorithmiques. Pour pallier ces problèmes, l'idée du traitement dans le domaine codé a été proposée. La mise en oeuvre d'une telle démarche n'est pas immédiate, plusieurs problèmes surgissent selon le traitement et le codeur considérés. Dans cette thèse on s'intéresse à des codeurs de type fréquentiel perceptuel tels MPEG-1 et TDAC de FTR&D et précisément pour des traitements de filtrage et de mixage. Le contexte applicatif illustré concerne le traitement du son pour la téléconférence multipoint. Le filtrage dans le domaine des sous-bandes est le premier problème abordé dans cette thèse. Une méthode générique a été développée, elle permet de transposer tout filtrage rationnel (FIR ou IIR) temporel dans ce nouveau domaine et pour tout banc de filtres à décimation maximale assurant la reconstruction parfaite. Cette méthode a été appliquée pour effectuer la spatialisation sonore par des filtres HRTF dans le domaine des sous-bandes. L'étude de la sommation sur les flux codés soulève plusieurs contraintes suivant le codeur considéré. Pour le codeur MPEG-1 Layer I et II, la problématique principale concerne la détermination des paramètres psychoacoustiques nécessaires à l'allocation de bits. L'algorithme proposé apporte donc une solution à ce problème par réestimation des seuils de masquage des signaux individuels à sommer puis recombinaison. Une méthode de réduction de débit est aussi dérivée à partir de cet algorithme. Pour le codeur TDAC de FTR&D la diminution de complexité dans le procédé de sommation repose sur sa structure particulière: elle profite de l'imbrication des dictionnaires de la quantification vectorielle qu'il utilise. La mise en valeur de l'intérêt du traitement dans le domaine codé a été concrétisée par la mise en oeuvre dans un pont audio de téléconférence multipoints. Ce pont assure les fonctionnalités de concentration de flux, de la correction de trames effacées due au phénomène de perte de paquets sur les réseaux à qualité de service non garantie et aussi de la gestion des flux discontinus.


Type:
Thèse
Date:
2001-05-21
Department:
Sécurité numérique
Eurecom Ref:
928
Copyright:
© ENST Paris. Personal use of this material is permitted. The definitive version of this paper was published in Thesis and is available at :

PERMALINK : https://www.eurecom.fr/publication/928