Identification of Ambiguous Multiword Expressions Using Sequence Models and Lexical Resources

Manon Scholivet 1 Carlos Ramisch 1
1 TALEP - Traitement Automatique du Langage Ecrit et Parlé
LIS - Laboratoire d'Informatique et Systèmes
Abstract : We present a simple and efficient tagger capable of identifying highly ambiguous multiword expressions (MWEs) in French texts. It is based on conditional random fields (CRF), using local context information as features. We show that this approach can obtain results that, in some cases, approach more sophisticated parser-based MWE identification methods without requiring syntactic trees from a tree-bank. Moreover, we study how well the CRF can take into account external information coming from a lexicon.
Type de document :
Communication dans un congrès
Proceedings of the 13th Workshop on Multiword Expressions (MWE 2017), 2017, Valencia, Spain. pp.167 - 175
Liste complète des métadonnées

Littérature citée [16 références]  Voir  Masquer  Télécharger

https://hal-amu.archives-ouvertes.fr/hal-01795903
Contributeur : Carlos Ramisch <>
Soumis le : mercredi 23 mai 2018 - 16:35:24
Dernière modification le : vendredi 25 mai 2018 - 01:40:11
Document(s) archivé(s) le : vendredi 24 août 2018 - 16:17:08

Fichier

W17-1723.pdf
Fichiers éditeurs autorisés sur une archive ouverte

Identifiants

  • HAL Id : hal-01795903, version 1

Collections

Citation

Manon Scholivet, Carlos Ramisch. Identification of Ambiguous Multiword Expressions Using Sequence Models and Lexical Resources. Proceedings of the 13th Workshop on Multiword Expressions (MWE 2017), 2017, Valencia, Spain. pp.167 - 175. 〈hal-01795903〉

Partager

Métriques

Consultations de la notice

50

Téléchargements de fichiers

16