Accentuation automatique de textes par des méthodes probabilistes

Derouault, A M;El Beze, M;Mérialdo, Bernard;Rozeron, B
"Techniques et sciences informatiques", Décembre 1994, Volume 13, N°6

Cet article décrit l'utilisation de méthodes probabilistes pour l'accentuation automatique de textes français. A partir d'un texte non accentué ou accentué de façon incomplète, une recherche dans un dictionnaire adapté permet de générer toutes les variantes accentuées possibles. Un modèle de langage probabiliste affecte à chacun de ces choix une probabilité, la variante la plus probable étant choisie pour tenir lieu de texte réaccentué. Une évaluation montre que ce procédé fournit un très bon score (97,6 % d'accents bien rétablis).


Type:
Journal
Date:
1994-12-01
Department:
Data Science
Eurecom Ref:
2267
Copyright:
Lavoisier

PERMALINK : https://www.eurecom.fr/publication/2267