Modèles probabilistes et étiquetage automatique
t.a.l.,traitement automatique des langues, traitements probabilistes et corpus, Volume 36, N°1-2, 1995
L’étude et le traitement du Langage Naturel s’intéressent de plus en plus aux approches prenant en compte de grands volumes de textes d’apprentissage, pour y collecter des statistiques qui permettent de construire des modèles, par exemple basés sur des considérations probabilistes. Dans cette présentation, nous décrivons les fondements de l’approche probabiliste du traitement du langage naturel, en discutant ses avantages et inconvénients. Puis nous nous intéressons au problème de l’étiquetage grammatical automatique, pour lequel nous détaillons l’utilisation d’un modèle appelé triclasse. Nous terminons en commentant plusieurs expériences d’étiquetage. The usage of large corpora is getting an increasing interest for various applications of Natural Language Processing. Statistics collected of large amounts of text can be used to derive complex models. In this paper, we describe the basics of the probabilistic approach to NLP, with a discussion of its advantages and drawbacks. Then we present its applications to the particular problem of text tagging, using a so-called “triclass” model. Finally, we present some tagging experiments.
| Mots Clés: | modèle de langage probabiliste, étiquetage grammatical, corpus de texte. probabilistic language model, text tagging, text corpus. |
| Type: | Journal |
| Langue: | French |
| Date: | Janvier 1995 |
| Département: | Communications Multimédia |
| Eurecom ref: | 88 |
| Copyright: | © Hermes. Personal use of this material is permitted. The definitive version of this paper was published in t.a.l.,traitement automatique des langues, traitements probabilistes et corpus, Volume 36, N°1-2, 1995 and is available at : http://at.revuesonline.com/ |
| Bibtex: | @article{EURECOM+88, doi = {http://at.revuesonline.com/}, year = {1995}, month = {01}, title = {{M}od{\`e}les probabilistes et {\'e}tiquetage automatique}, author = {{M}{\'e}rialdo, {B}ernard}, journal = {t.a.l.,traitement automatique des langues, traitements probabilistes et corpus, {V}olume 36, {N}°1-2, 1995}, url = {http://www.eurecom.fr/publication/88} } |
| Voir aussi: |
|
Permalink: http://www.eurecom.fr/publication/88


