Opinion Mining, une analyse de sentiments sur du texte
Exploration de l’analyse de sentiments sur des tweets et des textes avec Python et Orange DataMining.
Le projet
Ce projet universitaire avait pour objectif de répondre à deux questions assez fondamentales : qu’est-ce que l’analyse de sentiments, et comment peut-on l’appliquer concrètement ? Pour le coup, c’est le genre de sujet qui a l’air simple dit comme ça, mais qui devient beaucoup plus subtil dès qu’on regarde un vrai corpus.
Cas d’usage 1, les tweets de candidats à la présidentielle
En utilisant l’API Twitter, j’ai récupéré les 4 000 derniers tweets de plusieurs candidats pour analyser la tonalité de leur communication : positive, négative ou neutre. L’idée étant de voir si l’on peut caractériser une posture de campagne juste sur la charge émotionnelle des tweets.
Cas d’usage 2, les tweets sur l’Ukraine après l’invasion
Grâce à Orange DataMining et son intégration Twitter, j’ai analysé le sentiment global des tweets publiés sur le conflit ukrainien dans les jours suivant le début de l’invasion. C’est évidemment un sujet lourd, et les résultats sont à prendre avec beaucoup de prudence, notamment parce que l’analyse automatique passe mal l’ironie et la douleur.
Cas d’usage 3, l’analyse d’un webtoon
J’ai appliqué l’algorithme sur les textes du webtoon Eleceed pour en extraire les personnages principaux et analyser les sentiments associés aux dialogues. Les résultats étaient inégaux selon la complexité des phrases, ce qui fait que c’était pas totalement exploitable, mais l’expérience était riche en enseignements sur les limites du modèle.
Ce que j’ai retenu
L’opinion mining, c’est une technique d’extraction et de classification des opinions à partir de textes, utile notamment pour le suivi de tendances et la prédiction de comportements. Les résultats ne sont pas toujours directement actionnables, évidemment, mais ils offrent une lecture intéressante des dynamiques d’opinion, du coup c’est quelque chose qu’on peut intégrer à d’autres signaux plutôt que de s’appuyer dessus seul.
Contexte
Projet réalisé dans le cadre de la licence Informatique de l’université de Tours.
Technologies utilisées
-
Python
-
Orange DataMining
-
Tableau Software
-
Twitter API