Modèles probabilistes et étiquetage automatique

Mérialdo, Bernard
t.a.l.,Traitement automatique des langues, traitements probabilistes et corpus, Volume 36, N°1-2, 1995

L?étude et le traitement du Langage Naturel s?intéressent de plus en plus aux approches prenant en compte de grands volumes de textes d?apprentissage, pour y collecter des statistiques qui permettent de construire des modèles, par exemple basés sur des considérations probabilistes. Dans cette présentation, nous décrivons les fondements de l?approche probabiliste du traitement du langage naturel, en discutant ses avantages et inconvénients. Puis nous nous intéressons au problème de l?étiquetage grammatical automatique, pour lequel nous détaillons l?utilisation d?un modèle appelé triclasse. Nous terminons en commentant plusieurs expériences d?étiquetage. The usage of large corpora is getting an increasing interest for various applications of Natural Language Processing. Statistics collected of large amounts of text can be used to derive complex models. In this paper, we describe the basics of the probabilistic approach to NLP, with a discussion of its advantages and drawbacks. Then we present its applications to the particular problem of text tagging, using a so-called ?triclass? model. Finally, we present some tagging experiments.


Type:
Journal
Date:
1994-12-31
Department:
Data Science
Eurecom Ref:
88
Copyright:
© Hermes. Personal use of this material is permitted. The definitive version of this paper was published in t.a.l.,Traitement automatique des langues, traitements probabilistes et corpus, Volume 36, N°1-2, 1995 and is available at :
See also:

PERMALINK : https://www.eurecom.fr/publication/88