Un guide de l'analyse des sentiments : Qu'est-ce que c'est et comment ça marche ?

Anna Bredava
par Anna Bredavale 10 novembre 2022

Résumé de l'article

De nombreux professionnels vous avertissent que les sentiments négatifs nuisent à la réputation commerciale de votre marque sur le Web. Lisez ce guide pour comprendre ce qu'il en est vraiment, comment fonctionne l'analyse des sentiments, et décider si vous devez l'utiliser.

20 minutes de lecture

Dans l'article
  1. Qu'est-ce que l'analyse des sentiments ?
  2. Comment l'analyse des sentiments est-elle utilisée ?
  3. Comment fonctionne l'analyse des sentiments ?
  4. Quelle est la précision de l'analyse des sentiments ?
  5. Quelles sont les limites de l'analyse des sentiments ?
  6. Avez-vous tiré des conclusions de ce que vous avez lu ?

L'analyse des sentiments est le mot à la mode par excellence. Et comme tous les mots à la mode, c'est un concept qui est très souvent mal compris.

Chez Awario, nous fournissons un système d'analyse du sentiment des marques, et nous recevons beaucoup de questions sur le sentiment depuis que nous l'avons lancé.

Avec un peu de chance, ce guide vous aidera à mieux comprendre l'analyse des sentiments : de la manière dont elle est utilisée aux tenants et aboutissants de la mécanique et des techniques NLP qui la sous-tendent.

Commençons par l'éléphant d'une question :

Qu'est-ce que l'analyse des sentiments ?

L'analyse des sentiments, également appelée "opinion mining", est le processus qui consiste à déterminer l'émotion (souvent classée comme sentiment positif, négatif ou neutre) exprimée par une personne envers un sujet ou un phénomène.

Dans le contexte de l'écoute sociale et de la gestion de la réputation en ligne, l'analyse du sentiment est le plus souvent utilisée pour capter la voix du client et déterminer l'attitude des consommateurs à l'égard d'une marque, d'une entreprise, d'un produit ou d'une personne.

Comment l'analyse des sentiments est-elle utilisée ?

L'analyse des sentiments est sans doute l'élément le plus important à rechercher dans un outil d'écoute sociale. De l'analyse de la santé de la marque à l'amélioration du service client, voici quelques-unes des principales choses que les outils d'analyse des sentiments vous aident à faire.

1. surveiller la santé de la marque

The sentiment graph at Awario
Analyse de sentiments pour les mentions de Starbucks. Capture d'écran de Awario.

L'analyse des sentiments est un élément important de la surveillance de votre marque et de l'évaluation de sa santé. Dans votre tableau de bord de surveillance des médias sociaux, gardez un œil sur le ratio des mentions positives et négatives dans les conversations sur votre marque et examinez les thèmes clés dans les commentaires positifs et négatifs pour savoir ce dont vos clients ont tendance à se féliciter et à se plaindre le plus.

Lorsque vous examinez la part des mentions positives dans les conversations autour de votre marque, puis les mentions négatives et enfin les mentions neutres, vous travaillez avec trois chiffres, ce qui n'est pas une façon idéale de mesurer une chose.
Pour garder les choses simples, il est bon de calculer le sentiment net à la place.
Lesentiment net est une mesure (un chiffre sur une échelle de -1 à 1) qui vous montre comment votre marque se comporte en termes de sentiment.
La formule est la suivante (notez que les mentions neutres sont exclues de la mesure) :
En d'autres termes, le sentiment net vous indique si vous avez plus de mentions positives ou négatives (il ne prend en compte que les mentions comprenant des mots polarisés tels que bon et mauvais), et dans quelle mesure.
Voici un exemple : sur le graphique des sentiments pour les mentions de Kanye West ci-dessus, vous pouvez voir qu'il y a 16,5% de mentions positives et 20,7% de mentions négatives.
À partir de là, vous pouvez calculer le sentiment net :
(16.5 - 20.7) / (16.5 + 20.7) = - 4.2 / 37.2 = - 0.112
Le fait que le chiffre soit négatif nous indique qu'il y a plus de mentions négatives que de mentions positives ; la valeur elle-même - que les conversations négatives dominent de 11,2%.
Il semble que l'équipe de relations publiques de Kanye ait dû revoir ses derniers tweets.

2. Repérer rapidement les crises de réputation

A sentiment analysis graph from Awario
Un pic de mentions négatives de Starbucks causé par les rumeurs de menaces sanitaires. Capture d'écran de Awario.

L'analyse des sentiments n'est pas seulement utilisée pour l'analyse et le reporting des médias sociaux. Il est tout aussi important de se connecter quotidiennement à votre tableau de bord d'écoute sociale et d'être attentif aux pics de mentions négatives. De cette façon, vous serez en mesure de détecter rapidement une crise de réputation et d'éviter qu'elle ne se transforme en véritable catastrophe.

Dans Awario, avec l'aide de la fonction " Insights", vous pouvez également comprendre les raisons qui se cachent derrière les pics du volume de conversations négatives ou positives. En cliquant sur ces insights, vous pouvez creuser plus profondément dans les données historiques et en temps réel et voir ce qui a provoqué l'afflux de mentions négatives (ou positives).

Une analyse approfondie des sentiments peut sauver la réputation de votre marque lorsque ses mentions négatives augmentent sur le web à un rythme alarmant. En outre, elle vous aide à identifier les racines des performances positives et négatives.

3. Suivre les performances des campagnes

Awario's alert settings
Configuration de l'alerte pour la campagne #beforealexa. Capture d'écran de Awario.

De la même manière que vous surveillez votre marque, vous pouvez suivre les mentions de vos campagnes de marketing, de vos collaborations, des événements que vous organisez, ou littéralement de toute autre initiative de votre entreprise qui génère du buzz en ligne.

Comme pour le suivi de la marque, vous pouvez utiliser l'analyse des sentiments pour mesurer le sentiment général autour de la campagne et repérer les pics pour en identifier les raisons. En bref, Awario propose une analyse des sentiments multilingue, ce qui vous permet de suivre le fonctionnement de votre campagne dans le monde entier.

4. Effectuer une analyse de la concurrence

Analyse des sentiments pour Ford, Jeep et Dodge. Capture d'écran de Awario.

Le suivi du sentiment de vos concurrents vous aidera à voir quels aspects de leurs produits suscitent le plus (et le moins) d'enthousiasme chez les clients. De plus, le sentiment des concurrents peut également servir de référence lorsque vous analysez le sentiment derrière les mentions de votre propre marque et produit.

Disons que 50 % de vos mentions sont positives, 40 % sont négatives et le reste est neutre. Comment savoir si c'est une bonne ou une mauvaise chose sans repère ?

Pour évaluer rapidement votre position en termes de sentiment, il peut être utile d'analyser le sentiment de tous vos concurrents réunis.
Si vous détectez les mentions positives et négatives avec Awario, vous n'avez pas besoin de les calculer manuellement - il suffit d'accéder au rapport de comparaison d'alertes et de sélectionner tous vos concurrents pour voir leur sentiment total. À partir de là, vous pouvez l'utiliser comme référence pour votre propre sentiment.
The Alert comparison in Awario
Capture d'écran de Awario

5. améliorer le service à la clientèle

Mentions négatives de Oatly sur Twitter. Capture d'écran de Awario.

Surveiller le sentiment des clients et comprendre ce qu'ils pensent de vos produits ou services peut également aider votre équipe de support client à établir des priorités dans son travail.

Veillez à traiter en priorité les mentions contenant des mots négatifs sur votre marque (en particulier celles qui ont une portée plus importante). Dans Awario, vous pouvez le faire en utilisant des filtres dans votre flux de mentions.

Si vous saisissez rapidement ces conversations négatives sur les réseaux sociaux, il y a de fortes chances que vous puissiez retourner la situation pour ce client spécifique et améliorer l'expérience client pour les autres consommateurs.

Comment fonctionne l'analyse des sentiments ?

Dans le jargon de la science des données, l'analyse des sentiments est un problème de classification : l'algorithme se voit présenter des morceaux de texte qui doivent être classés comme positifs, négatifs ou neutres. Le problème est généralement abordé à l'aide du traitement du langage naturel (NLP) de l'une de ces trois façons : apprentissage automatique supervisé, techniques basées sur des règles ou une combinaison des deux approches.

Jetons un coup d'œil à chacun de ces modèles d'analyse des sentiments.

1. Apprentissage automatique supervisé (ML)

Dans l'apprentissage automatique supervisé, le système est présenté avec un ensemble complet de données étiquetées pour la formation. Cet ensemble de données est constitué de documents dont le sentiment a déjà été déterminé par des évaluateurs humains (data scientists). L'ordinateur apprend ensuite les classificateurs d'analyse du sentiment du document à partir de l'ensemble d'apprentissage et étiquette de nouvelles données d'entrée (l'ensemble de test).

En d'autres termes, l'utilisation du ML permet d'automatiser les fonctions de bas niveau pour l'analyse de texte sur lesquelles repose l'analyse des sentiments.

Source : Exploration, visualisation et modélisation des Big Data avec R

Divers algorithmes de classification et réseaux neuronaux peuvent être utilisés dans ce modèle d'analyse des sentiments, tels que Naive Bayes, la régression logistique, les machines à vecteurs de support, etc.

Quelle que soit l'approche, le système attribue généralement un score à tous les sujets, catégories, mots et phrases du texte qu'il analyse pour refléter son sentiment : par exemple, sur une échelle de -1 pour "extrêmement négatif" à 1 pour "extrêmement positif". Ces notes seront ensuite additionnées pour tous les mots du texte et divisées par le nombre de mots qu'il contient pour obtenir la note moyenne.

À partir de là, c'est au chercheur de fixer les limites particulières. Par exemple, vous pourriez dire qu'un score global entre -1 et -0,33 devrait signifier que l'affirmation est négative, utiliser -0,33 à 0,33 pour neutre, et 0,33 à 1 pour positif.

Avantages : Les techniques d'apprentissage automatique supervisé permettent de créer des modèles formés adaptés à l'objectif spécifique de l'analyse des données.

Inconvénients : ces modèles présentent souvent une faible adaptabilité entre les domaines ou les différents styles d'écriture.

2. Méthodes basées sur des règles

Un système à base de règles utilise un ensemble de règles créées par l'homme (et éventuellement enrichies par la machine) pour l'analyse de textes. Ces règles comprennent généralement deslexiques de sentiments(c'est-à-dire des dictionnaires de mots et d'expressions pré-étiquetés).

Voici un exemple très simple de ce à quoi peut ressembler un dictionnaire :

Word Score de sentiment
Fantastique 1
Bon 0.5
D'accord 0
Mauvais -0.5
Terrible -1

Une fois le système au travail, la première étape consiste à rechercher des mots du dictionnaire dans le texte qu'il analyse(extraction d'entités).

À partir de là, les calculs sont les mêmes que pour les modèles d'apprentissage automatique : il faut additionner les scores pour chaque mot et diviser le résultat par le nombre de mots pour obtenir la moyenne.

Enfin, déterminez le sentiment du texte en fonction des limites que vous avez fixées pour le positif, le négatif et le neutre.

Prenons l'exemple de la phrase suivante :

Le café était correct, mais la nourriture était horrible.

Puisque ce texte contient deux mots de notre dictionnaire, le score serait le suivant :

(0 + (-1)) / 2 = -1 / 2 = -0.5

Si vous avez décidé qu'un score compris entre -1 et -0,33 signifie que l'affirmation est négative, voilà, cette phrase sera étiquetée comme négative par le système.

Avantages : Il est plus facile de construire des systèmes à base de règles que de déployer des techniques de ML, et ils sont souvent moins gourmands en ressources que les algorithmes d'apprentissage automatique. Ils permettent également au chercheur d'avoir un contrôle total sur le vocabulaire et peuvent donc avoir une meilleure couverture des termes.

Inconvénients : les systèmes de base basés sur des règles examinent des mots ou des phrases individuels et non la manière dont ils sont utilisés dans une séquence. L'ajout de nouvelles règles peut aider, mais à terme, l'ensemble du système peut devenir très complexe. En outre, le nombre de mots dans les dictionnaires est limité, ce qui peut poser des problèmes pour le traitement du langage naturel dans des environnements dynamiques (je vous regarde, médias sociaux). En d'autres termes, la technologie basée sur les lexiques nécessitera souvent un réglage fin continu.

3. Approches hybrides

Parfois, les développeurs de logiciels combinent l'apprentissage automatique supervisé et les approches basées sur le lexique pour améliorer la précision des sentiments sans sacrifier les performances.

Ces techniques peuvent être utilisées côte à côte de différentes manières, mais le plus souvent, un système à base de règles (qui est généralement plus rapide que les algorithmes d'apprentissage automatique) tentera de classer le sentiment d'une déclaration. Si un certain degré de confiance n'est pas atteint (par exemple, lorsque peu ou pas de mots de la phrase sont disponibles dans le lexique), un classificateur d'apprentissage automatique sera utilisé pour identifier le sentiment de la déclaration.

Les avantages : Les approches hybrides peuvent bénéficier des avantages des méthodes basées sur les règles et de l'apprentissage automatique, ce qui permet aux entreprises qui utilisent ce type d'analyse des sentiments d'obtenir de meilleures informations marketing. Elles peuvent avoir les avantages en termes de performance des techniques basées sur le lexique la plupart du temps, mais les dépasser en termes de précision pour tenir compte des déclarations dont le sentiment ne peut pas être facilement identifié avec une approche basée sur les règles.

Contre : Naturellement, ces systèmes sont ceux qui demandent le plus de temps et d'efforts pour être construits.

4. Support pour toutes les langues

Vous avez bien lu : l'algorithme d'analyse des sentiments fonctionne dans toutes les langues ! Nous avons effectué des tests approfondis pour les langues les plus populaires auprès des utilisateurs d'Awario (anglais, français, espagnol, allemand et portugais) ainsi que des tests plus limités pour d'autres langues, et nous sommes heureux de pouvoir dire que la précision de l'analyse des sentiments pour aucune langue n'est inférieure à 65 %.

Quelle est la précision de l'analyse des sentiments ?

La précision de l'analyse des sentiments est un terme utilisé pour désigner le degré de concordance entre les résultats d'un système d'analyse des sentiments et les évaluations humaines.

Toutefois, ce n'est pas aussi simple qu'il n'y paraît. Les recherches montrent que les évaluateurs humains ne sont d'accord entre eux qu'entre 65 % et 80 % du temps.

Pour suivre la déclaration, vous pouvez la paraphraser en disant :

La précision de l'analyse des sentiments du cerveau humain se situe entre 65% et 80%.

Le sentiment est souvent subjectif, ce qui rend difficile la mesure de la précision. En moyenne, les chercheurs s'accordent à dire qu'un système d'analyse des sentiments doit avoir une précision d'au moins 50 % pour être considéré comme efficace ; une précision de plus de 65 % est considérée comme bonne, même si elle ne semble pas impressionnante.

Awario, avec sa précision d'analyse des sentiments d'un peu plus de 70 %, fait presque aussi bien que les humains.

Il y a aussi une autre raison pour laquelle la précision n'est pas toujours le meilleur moyen de mesurer la qualité d'un algorithme.

Voici un excellent exemple de cas où ce n'est pas le cas (sans rapport avec l'analyse des sentiments) :

Croiriez-vous quelqu'un qui prétendrait avoir créé un modèle entièrement dans sa tête pour identifier les terroristes essayant de monter à bord des avions avec une précision supérieure à 99 % ? Eh bien, voici le modèle : il suffit de cataloguer chaque personne qui prend un vol depuis un aéroport américain comme n'étant pas un terroriste. Compte tenu du nombre moyen de 800 millions de passagers par an sur les vols américains et des 19 terroristes (confirmés) qui ont embarqué sur des vols américains entre 2000 et 2017, ce modèle atteint une précision étonnante de 99,9999999 % ! Cela peut sembler impressionnant, mais je soupçonne que le ministère américain de la sécurité intérieure ne va pas appeler de sitôt pour acheter ce modèle. Bien que cette solution ait une précision presque parfaite, ce problème est l'un de ceux pour lesquels la précision n'est clairement pas une mesure adéquate !

Les deux autres facteurs qui indiquent aux chercheurs la qualité de leur algorithme sont la précision et le rappel.

Laprécision est le pourcentage d'instances correctement identifiées comme X par le système parmi toutes les instances identifiées comme X par le système.

Lerappel, quant à lui, est le rapport entre le nombre d'instances de X correctement identifiées par le système et toutes les instances de X dans l'ensemble de données.

Source : Wikipedia

Par exemple, imaginons que nous ayons un ensemble de données de 10 déclarations : 7 d'entre elles sont étiquetées par des experts humains comme positives, et 3 comme négatives.

Un système d'analyse des sentiments identifie 5 déclarations comme positives. Sur ces 5 instances, seules 3 sont réellement positives (selon l'évaluation des experts humains).

La précision du système est de 3/5 et son rappel de 3/7.

Quelles sont les limites de l'analyse des sentiments ?

Nous avons vu que l'analyse des sentiments est délicate même pour les humains, sans parler des machines - mais pourquoi ? Voici les principaux défis auxquels sont confrontés les systèmes d'analyse des sentiments (ceci est vrai pour toutes les langues).

1. Sarcasmes

Source : Giphy

Tout type de traitement du langage naturel est délicat pour les documents courts, et l'analyse des sentiments ne fait pas exception. Les messages des médias sociaux sont généralement plus courts que d'autres types de contenu Web, comme les articles d'actualité, ce qui signifie qu'il y a souvent peu de contexte avec lequel travailler. Cela est particulièrement important pour les déclarations sarcastiques ou ironiques.

Dans de nombreux cas, le sarcasme est assez évident pour les gens, mais extrêmement difficile à détecter pour les machines.

Voici un exemple :

Il ne m'a fallu que 5 minutes pour prendre un café au Starbucks. Un bon début de journée !

Il ne m'a fallu que 30 minutes pour prendre un café au Starbucks. Un bon début de journée !

2. Négations

La négation est un moyen linguistique permettant d'inverser le sens des mots, des phrases, voire de phrases entières. Pour les besoins de l'analyse des sentiments, il est important non seulement d'identifier la négation, mais aussi de déterminer quels mots sont affectés par elle afin que le système puisse inverser leur sentiment.

Comme le sarcasme, la négation est assez facile à interpréter pour les humains, mais elle peut être assez difficile pour les ordinateurs.

Je ne dirais pas que le café était particulièrement bon.

Pour traiter la négation, les algorithmes de classification du sentiment vont souvent inverser le sentiment de tous les mots à partir du mot de négation et jusqu'au prochain signe de ponctuation. Cependant, cette approche peut parfois échouer, comme vous pouvez le voir dans l'exemple ci-dessous.

J'espérais que le café serait excellent. Il ne l'était pas.

3. Ambiguïté

Les mots émotionnels, tels que l'amour et la haine, sont faciles à interpréter par les humains et les machines. Cependant, certains mots peuvent être négatifs dans un contexte, et neutres ou positifs dans un autre, comme dans l'exemple ci-dessous.

J'ai tendance à boire du café glacé en été.

Quand j'ai enfin eu mon café, il était glacé.

4. Multipolarité

Souvent, le texte que vous analysez exprime plusieurs émotions à la fois. Lorsque vous êtes en présence d'un texte qui exprime une émotion à l'égard d'un objet ou d'un sujet, et une émotion différente à l'égard d'un autre, vous avez affaire à la multipolarité.

Le café Starbucks est bien meilleur que celui de Dunkin'.

(Plug sans vergogne : si vous vous demandez laquelle est vraiment la meilleure, consultez notre analyse de l'écoute sociale des deux marques).

Dans ce cas, un système d'extraction d'opinion de base pourrait conclure que le sentiment de la déclaration est positif, sur la base de la phrase beaucoup mieux. Cependant, si la marque que vous surveillez est Dunkin', je parie que vous ne seriez pas d'accord. Pour traiter la multipolarité, on utilise une approche appelée analyse des sentiments basée sur les aspects.

Avez-vous tiré des conclusions de ce que vous avez lu ?

J'espère que ce guide vous a donné un aperçu direct de l'analyse des sentiments, de ses utilisations et de ses défis. Pendant un bref instant, vous pourriez penser qu'elle est difficile à utiliser ou qu'elle est totalement inutile pour les spécialistes du marketing. Cependant, en fonction de vos objectifs, vous pouvez facilement adapter l'analyse des sentiments à votre routine marketing quotidienne.

Vous avez encore des questions sur le sentiment ? Faites-nous en part ! Rendez-vous sur nos pages sociales pour y laisser vos commentaires et poser vos questions.

Postes connexes