Guía del análisis de opiniones: ¿Qué es y cómo funciona?
Resumen del artículo
Muchos profesionales advierten de que el sentimiento negativo perjudica la reputación comercial de su marca en la web. Lee esta guía para entender qué es realmente, cómo funciona el análisis de sentimientos y decidir si deberías utilizarlo.
20 minutos de lectura
El análisis del sentimiento es la palabra de moda por excelencia. Y como palabra de moda, es un concepto que a menudo se malinterpreta.
En Awario, proporcionamos un sistema de análisis del sentimiento de marca, y hemos recibido muchas preguntas sobre el sentimiento desde que lo lanzamos.
Con un poco de suerte, esta guía le ayudará a comprender mejor el análisis de sentimientos: desde cómo se utiliza hasta los entresijos de la mecánica y las técnicas de PNL que lo sustentan.
Empecemos con el elefante de una pregunta:
¿Qué es el análisis de sentimientos?
Elanálisis de sentimientos, también llamado minería de opiniones, es el proceso de determinar la emoción (a menudo clasificada como sentimiento positivo, negativo o neutro) expresada por alguien hacia un tema o fenómeno.
En el contexto de la escucha social y la gestión de la reputación en línea, el análisis del sentimiento se utiliza habitualmente para captar la voz del cliente y determinar la actitud de los consumidores hacia una marca, empresa, producto o persona.
¿Cómo se utiliza el análisis de opiniones?
El análisis del sentimiento es posiblemente lo más importante que hay que buscar en una herramienta de escucha social. Desde el análisis de la salud de la marca hasta la mejora del servicio de atención al cliente, estas son algunas de las principales cosas que las herramientas de análisis de sentimiento te ayudan a hacer.
1. Controlar la salud de la marca
El análisis del sentimiento es una parte importante del seguimiento de su marca y de la evaluación de su salud. En su Dashboard de monitorización de redes sociales, vigile la proporción de menciones positivas y negativas en las conversaciones sobre su marca e investigue los temas clave de los comentarios positivos y negativos para saber qué es lo que más elogian y de lo que más se quejan sus clientes.
2. Detectar a tiempo las crisis de reputación
El análisis del sentimiento no sólo se utiliza para el análisis de las redes sociales y la elaboración de informes. También es importante conectarse a diario al Dashboard de escucha de las redes sociales y detectar cualquier pico de menciones negativas. De este modo, podrá detectar a tiempo una crisis de reputación y evitar que se convierta en un desastre total.
En Awario, con la ayuda de Insights, también puedes entender las razones detrás de cualquier pico en el volumen de conversaciones negativas o positivas. Al hacer clic en estos insights, puedes profundizar en los datos históricos y en tiempo real y ver qué causó la afluencia de menciones negativas (o positivas).
Un análisis exhaustivo del sentimiento puede salvar la reputación de su marca cuando sus menciones negativas aumentan en la red a un ritmo alarmante. Además, te ayuda a identificar las raíces de los resultados positivos y negativos.
Al registrarme acepto las Condiciones de uso y la Política de privacidad
3. Seguimiento del rendimiento de las campañas
Del mismo modo que controla su marca, puede hacer un seguimiento de las menciones de sus campañas de marketing, colaboraciones, eventos que organice o, literalmente, cualquier otra iniciativa de su empresa que genere expectación en Internet.
Al igual que con la monitorización de la marca, puedes utilizar el análisis de sentimiento para medir el sentimiento general en torno a la campaña y buscar los picos para identificar las razones detrás de ellos. Como punto rápido, Awario proporciona análisis de sentimiento multilingüe, por lo que puedes realizar un seguimiento de cómo funciona tu campaña en todo el mundo.
4. Realizar un análisis de la competencia
Monitorizar el sentimiento de sus competidores le ayudará a ver qué aspectos de sus productos entusiasman más (y menos) a los clientes. Además, el sentimiento de la competencia también puede servir como punto de referencia para analizar el sentimiento detrás de las menciones de su propia marca y producto.
Digamos que el 50% de tus menciones son positivas, el 40% negativas y el resto neutras. ¿Cómo saber si eso es bueno o malo sin un punto de referencia?
5. Mejorar la atención al cliente
Supervisar el sentimiento de los clientes y comprender cómo se sienten con respecto a sus productos o servicios también puede ayudar a su equipo de Atención al Cliente a priorizar su trabajo.
Asegúrate de abordar en primer lugar las menciones que contengan palabras negativas sobre tu marca (sobre todo las de mayor alcance); en Awario, puedes hacerlo utilizando filtros en tu feed de menciones.
Si detectas a tiempo estas conversaciones negativas en las redes sociales, lo más probable es que puedas darle la vuelta a la situación para este cliente concreto y mejorar la experiencia del cliente para otros consumidores.
Al registrarme acepto las Condiciones de uso y la Política de privacidad
¿Cómo funciona el análisis de opiniones?
En la jerga de la ciencia de datos, el análisis de sentimientos es un problema de clasificación: al algoritmo se le presentan fragmentos de texto que deben clasificarse como positivos, negativos o neutros. El problema suele abordarse con la ayuda del Procesamiento del Lenguaje Natural (PLN) de una de estas tres formas: aprendizaje automático supervisado, técnicas basadas en reglas o una combinación de ambos enfoques.
Veamos cada uno de estos modelos de análisis de sentimientos.
1. Aprendizaje automático supervisado (AMS)
En el aprendizaje automático supervisado, se presenta al sistema un conjunto completo de datos etiquetados para el entrenamiento. Este conjunto de datos consiste en documentos cuyo sentimiento ya ha sido determinado por evaluadores humanos (científicos de datos). A continuación, el ordenador aprende los clasificadores de análisis del sentimiento del documento a partir del conjunto de entrenamiento y etiqueta nuevos datos de entrada (el conjunto de prueba).
En otras palabras, el uso de ML permite automatizar funciones de bajo nivel para el análisis de texto en las que se basa el análisis de sentimientos.
En este modelo de análisis de sentimientos se pueden utilizar varios algoritmos de clasificación y redes neuronales, como Naive Bayes, regresión logística, Support Vector Machines y otros.
Sea cual sea el enfoque, el sistema suele asignar una puntuación a todos los temas, categorías, palabras y frases del texto que analiza para reflejar su sentimiento: por ejemplo, en una escala de -1 para "extremadamente negativo" a 1 para "extremadamente positivo". Estas puntuaciones se suman para todas las palabras del texto y se dividen por el número de palabras para obtener la puntuación media.
A partir de ahí, corresponde al investigador establecer los límites concretos. Por ejemplo, podría decirse que una puntuación global entre -1 y -0,33 debería significar que la afirmación es negativa, utilizar de -0,33 a 0,33 para neutra y de 0,33 a 1 para positiva.
Pros: las técnicas de aprendizaje automático supervisado permiten crear modelos entrenados y adaptados al propósito específico del análisis de datos.
Contras: Estos modelos suelen tener poca adaptabilidad entre dominios o diferentes estilos de escritura.
2. Métodos basados en reglas
Un sistema basado en reglas utiliza un conjunto de reglas elaboradas por humanos (y, opcionalmente, enriquecidas por máquinas) para el análisis de textos. Estas reglas suelen incluirléxicos de sentimientos(es decir, diccionarios de palabras y expresiones preetiquetadas).
He aquí un ejemplo muy básico de lo que puede ser un diccionario:
Palabra | Sentimiento |
---|---|
Fantástico | 1 |
Bien | 0.5 |
Vale | 0 |
Mal | -0.5 |
Terrible | -1 |
Una vez que el sistema está en funcionamiento, el primer paso es buscar palabras del diccionario en el texto que está analizando(extracción de entidades).
A partir de ahí, las matemáticas son las mismas que con los modelos de aprendizaje automático: sumar las puntuaciones de cada palabra y dividir el resultado por el número de palabras para obtener la media.
Por último, determina el sentimiento del texto en función de los límites que establezcas para positivo, negativo y neutro.
Tomemos como ejemplo la siguiente frase:
El café estaba bien, pero la comida era terrible.
Como este texto contiene dos palabras de nuestro diccionario, la puntuación sería:
(0 + (-1)) / 2 = -1 / 2 = -0.5
Si ha decidido que una puntuación entre -1 y -0,33 significa que la frase es negativa, ahí lo tiene: esta frase será etiquetada como negativa por el sistema.
Ventajas: crear sistemas basados en reglas es más fácil que aplicar técnicas de ML y, a menudo, no requieren tantos recursos como los algoritmos de aprendizaje automático. Además, ofrecen al investigador un control total sobre el vocabulario y, por tanto, pueden tener una mejor cobertura de términos.
Contras: los sistemas básicos basados en reglas se fijan en palabras o frases sueltas y no en cómo se utilizan en una secuencia. Añadir nuevas reglas puede ayudar, pero a la larga todo el sistema puede volverse muy complejo. Además, el número de palabras de los diccionarios es finito, lo que puede plantear problemas para el procesamiento del lenguaje natural en entornos dinámicos (te estoy mirando a ti, redes sociales). En otras palabras, la tecnología basada en el léxico requerirá a menudo un ajuste fino continuo.
3. Enfoques híbridos
A veces, los desarrolladores de software combinan el aprendizaje automático supervisado y los enfoques basados en léxicos para mejorar la precisión de los sentimientos sin sacrificar el rendimiento.
Estas técnicas pueden utilizarse conjuntamente de distintas formas, pero lo más habitual es que un sistema basado en reglas (que suele ser más rápido que los algoritmos de ML) intente clasificar el sentimiento de una frase. Si no se alcanza un cierto grado de confianza (por ejemplo, cuando en el léxico hay pocas o ninguna palabra de la frase), se utilizará un clasificador de aprendizaje automático para identificar el sentimiento de la frase.
Ventajas: Los enfoques híbridos pueden tener las ventajas tanto de los métodos basados en reglas como de los métodos de aprendizaje automático, lo que ayuda a las empresas que utilizan este tipo de análisis de sentimiento a obtener mejores conocimientos de marketing. Pueden tener las ventajas de rendimiento de las técnicas basadas en léxico la mayor parte del tiempo, pero superarlas en precisión para dar cuenta de las declaraciones cuyo sentimiento no se puede identificar fácilmente con un enfoque basado en reglas.
Contras: Naturalmente, estos sistemas son los que más tiempo y esfuerzo requieren.
4. Compatibilidad con todos los idiomas
Has leído bien: ¡el algoritmo de sentimiento funciona en todos y cada uno de los idiomas! Hemos realizado pruebas exhaustivas para los idiomas más populares entre los usuarios de Awario (inglés, francés, español, alemán y portugués), así como pruebas más pequeñas para otros idiomas, y nos complace decir que la precisión del análisis de sentimiento para ningún idioma cae por debajo del 65%.
¿Qué grado de precisión tiene el análisis de opiniones?
La precisión del análisis de sentimientos es un término que se utiliza para referirse a la medida en que los resultados de un sistema de análisis de sentimientos coinciden con las evaluaciones humanas.
Sin embargo, no es tan sencillo como parece: los estudios demuestran que los evaluadores humanos sólo coinciden entre sí entre el 65% y el 80% de las veces.
Para seguir el enunciado, se puede parafrasear esto diciendo:
La precisión del análisis de sentimientos del cerebro humano se sitúa entre el 65% y el 80%.
El sentimiento suele ser subjetivo, lo que dificulta medir la precisión. Por término medio, los investigadores coinciden en que un sistema de análisis de sentimientos debe tener al menos un 50% de precisión para considerarse eficaz; una precisión superior al 65% se considera buena, aunque no suene impresionante.
Awario, con una precisión en el análisis de sentimientos ligeramente superior al 70%, lo hace casi tan bien como los humanos.
También hay otra razón por la que la precisión no siempre es la forma definitiva de medir lo bueno que es un algoritmo.
He aquí un buen ejemplo de cuándo no lo es (sin relación con el análisis de sentimientos):
¿Creerías a alguien que afirma haber creado un modelo totalmente mental para identificar a los terroristas que intentan embarcar en vuelos con una precisión superior al 99%? Pues bien, el modelo es el siguiente: basta con etiquetar a todas las personas que vuelan desde un aeropuerto estadounidense como no terroristas. Teniendo en cuenta la media de 800 millones de pasajeros en vuelos estadounidenses al año y los 19 terroristas (confirmados) que embarcaron en vuelos estadounidenses entre 2000 y 2017, este modelo alcanza una asombrosa precisión del 99,9999999%. Puede parecer impresionante, pero tengo la sospecha de que el Departamento de Seguridad Nacional de Estados Unidos no llamará en breve para comprar este modelo. Aunque esta solución tiene una precisión casi perfecta, en este problema la precisión no es una métrica adecuada.
Los otros dos factores que indican a los investigadores lo bueno que es su algoritmo son la precisión y el recuerdo.
Laprecisión es el porcentaje de instancias identificadas correctamente como X por el sistema entre todas las instancias identificadas como X por el sistema.
Por otro lado, larecuperación es la relación entre el número de casos de X identificados correctamente por el sistema y todos los casos de X en el conjunto de datos.
Por ejemplo, imaginemos que tenemos un conjunto de datos de 10 afirmaciones: 7 de ellas son etiquetadas por expertos humanos como positivas y 3 como negativas.
Un sistema de análisis de sentimientos identifica 5 afirmaciones como positivas. De estos 5 casos, solo 3 son realmente positivos (según la evaluación de expertos humanos).
La precisión del sistema es de 3/5, mientras que su recall es de 3/7.
¿Cuáles son las advertencias del análisis de sentimientos?
Hemos visto que el análisis de sentimientos es complicado incluso para los humanos, por no hablar de las máquinas, pero ¿por qué? He aquí los mayores retos a los que se enfrentan los sistemas de análisis de sentimientos (esto es válido para todos los idiomas).
1. Sarcasmo
Cualquier tipo de procesamiento del lenguaje natural es complicado con documentos cortos, y el análisis de sentimientos no es una excepción. Las publicaciones en redes sociales suelen ser más cortas que otros tipos de contenido web, como los artículos de noticias, lo que significa que a menudo hay poco contexto con el que trabajar. Esto es especialmente importante en el caso de afirmaciones sarcásticas o irónicas.
En muchos casos, el sarcasmo es bastante obvio para las personas, pero extremadamente difícil de detectar para las máquinas.
He aquí un ejemplo:
Sólo he tardado 5 minutos en tomarme un café en Starbucks. ¡Gran comienzo del día!
Sólo he tardado 30 minutos en tomarme un café en Starbucks. ¡Gran comienzo del día!
2. Negaciones
Las negaciones son un medio lingüístico de invertir el significado de palabras, frases e incluso oraciones enteras. A efectos del análisis de sentimientos, es importante no sólo identificar la negación, sino también averiguar qué palabras se ven afectadas por ella para que el sistema pueda revertir su sentimiento.
Al igual que el sarcasmo, la negación es bastante fácil de interpretar para los humanos, pero puede ser todo un reto para los ordenadores.
No diría que el café era especialmente bueno.
Para hacer frente a la negación, los algoritmos de clasificación de sentimientos suelen revertir el sentimiento de todas las palabras a partir de la palabra de negación y hasta el siguiente signo de puntuación. Sin embargo, este enfoque puede fallar a veces, como puede verse en el ejemplo siguiente.
Esperaba que el café fuera estupendo. No lo era.
3. Ambigüedad
Las palabras emocionales, como amor y odio, son fáciles de interpretar tanto para los humanos como para las máquinas. Sin embargo, algunas palabras pueden ser negativas en un contexto y neutras o positivas en otro, como en el ejemplo siguiente.
Suelo tomar café helado en verano.
Cuando por fin me dieron el café, estaba helado.
4. Multipolaridad
A menudo, el texto que analizamos expresa varias emociones a la vez. Cuando un texto expresa una emoción hacia un objeto o tema y otra emoción hacia otro, nos encontramos ante un caso de multipolaridad.
El café de Starbucks es mucho mejor que el de Dunkin'.
(Plugin desvergonzado: si te preguntas cuál es realmente mejor, visita nuestro análisis de escucha social de las dos marcas).
En este caso, un sistema básico de minería de opiniones podría concluir que el sentimiento de la afirmación es positivo, basándose mucho mejor en la frase. Sin embargo, si la marca que está monitorizando es Dunkin', apuesto a que no estaría de acuerdo. Para hacer frente a la multipolaridad, se utiliza un enfoque llamado análisis de sentimiento basado en aspectos.
¿Ha sacado alguna conclusión de lo que ha leído?
Espero que esta guía te haya proporcionado una visión directa del análisis de sentimientos, sus usos y sus retos. Por un breve instante, podrías pensar que es difícil de usar o que es inútil para los profesionales del marketing en absoluto. Sin embargo, dependiendo de tus objetivos, puedes adaptar el análisis de sentimiento a tu rutina diaria de marketing fácilmente.
¿Aún tiene preguntas sobre el sentimiento? ¡Háganoslo saber! Vaya a nuestras páginas sociales para dejar sus comentarios y hacer sus preguntas allí.