Typologie automatique des langues à partir de treebanks

Résumé : La typologie des langues repose sur l'étude de la réalisation de propriétés ou phénomènes linguistiques dans plusieurs langues ou familles de langues. Nous abordons dans cet article la question de la typologie syntaxique et proposons une méthode permettant d'extraire automatiquement ces propriétés à partir de treebanks, puis de les analyser en vue de dresser une telle typologie. Nous décrivons cette méthode ainsi que les outils développés pour la mettre en œuvre. Celle-ci a été appliquée à l'analyse de 10 langues décrites dans le Universal Dependencies Treebank. Nous validons ces résultats en montrant comment une technique de classification permet, sur la base des informations extraites, de reconstituer des familles de langues.
Type de document :
Communication dans un congrès
Traitement Automatique des Langues Naturelles 22, Jun 2015, Caen, France. pp.232-243, 2015
Liste complète des métadonnées

Littérature citée [15 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-01498942
Contributeur : Gilles Pouchoulin <>
Soumis le : mercredi 19 avril 2017 - 14:22:34
Dernière modification le : vendredi 21 avril 2017 - 01:05:53

Fichier

Blache-TALN2015-final.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01498942, version 1

Collections

Citation

Philippe Blache, Grégoire Montcheuil, Stéphane Rauzy. Typologie automatique des langues à partir de treebanks. Traitement Automatique des Langues Naturelles 22, Jun 2015, Caen, France. pp.232-243, 2015. 〈hal-01498942〉

Partager

Métriques

Consultations de
la notice

52

Téléchargements du document

38