Adapted Sentiment Similarity Seed Words For French Tweets' Polarity Classification - Aix-Marseille Université Accéder directement au contenu
Autre Publication Scientifique Année : 2018

Adapted Sentiment Similarity Seed Words For French Tweets' Polarity Classification

Mots-graines de Similarité de Sentiment Adaptés pour la Classification de Polarité des Tweets en Langue Française.

Résumé

We present, in this paper, our contribution in DEFT 2018 task 2 : "Global polarity", determining the overall polarity (Positive, Negative, Neutral or MixPosNeg) of tweets regarding public transport, in French language. Our system is based on a list of sentiment seed-words adapted for French public transport tweets. These seed-words are extracted from DEFT's training annotated dataset, and the sentiment relations between seed-words and other terms are captured by cosine measure of their word embeddings representations, using a French language word embeddings model of 683k words. Our semi-supervised system achieved an F1-measure equals to 0.64. RÉSUMÉ Mots-graines de Similarité de Sentiment Adaptés pour la Classification de Polarité des Tweets en Langue Française. Cet article présente notre contribution en DEFT 2018 tâche 2 : "Polarité globale", déterminant la polarité globale (Positif, Négatif, Neutre ou MixPosNeg) des tweets concernant les transports publics, en langue Française. Notre système est basé sur une liste de mots-graines de sentiment adaptés aux tweets de transport public français. Ces mots-graines sont extraits de corpus annoté de DEFT, et les relations entre les mots-graine et les autres termes sont capturées par la similarité en mesure de cosinus entre les vecteurs représentants les mots, en utilisant un modèle word2vec en langue Française de 683k mots. Notre système semi-supervisé a atteint un F1-measure égale à 0,64.
Cet article présente notre contribution en DEFT 2018 tâche 2 : "Polarité globale", déterminant la polarité globale (Positif, Négatif, Neutre ou MixPosNeg) des tweets concernant les transports publics, en langue Française. Notre système est basé sur une liste de mots-graines de sentiment adaptés aux tweets de transport public français. Ces mots-graines sont extraits de corpus annoté de DEFT, et les relations entre les mots-graine et les autres termes sont capturées par la similarité en mesure de cosinus entre les vecteurs représentants les mots, en utilisant un modèle word2vec en langue Française de 683k mots. Notre système semi-supervisé a atteint un F1-measure égale à 0,64.
Fichier principal
Vignette du fichier
Amal_Htait_DEFT2018_newFormat.pdf (80.58 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01794183 , version 1 (17-05-2018)

Identifiants

  • HAL Id : hal-01794183 , version 1

Citer

Amal Htait. Adapted Sentiment Similarity Seed Words For French Tweets' Polarity Classification. 2018. ⟨hal-01794183⟩
158 Consultations
526 Téléchargements

Partager

Gmail Facebook X LinkedIn More