El análisis multilingüe del sentimiento es un proceso basado en IA que consiste en extraer sentimientos a partir de datos en varios idiomas. Se logra a través de modelos de aprendizaje automático (ML, por sus siglas en inglés) en cada lengua materna creados de forma individual para diferentes idiomas. Para desarrollar estos modelos, se recopila un conjunto muy variado de datos etiquetados de forma manual para cada idioma. Los procesos clave incluyen los siguientes:

  • Etiquetado de categorías gramaticales (POS, por sus siglas en inglés): Desarrollado para identificar conjunciones, oraciones subordinadas, preposiciones y sustantivos en cada idioma.
  • Lematización: Para reconocer y aplicar las reglas de conjugación de los sustantivos y los verbos según el género.
  • Construcciones gramaticales: Desarrolladas para definir negaciones y amplificadores a fin de identificar palabras negativas y positivas.
  • Polaridad: Para determinar la polaridad negativa y positiva de las palabras, entre -1 y +1, que se combinan a fin de obtener el sentimiento general en los datos.

Contar con un modelo de lengua materna es importante porque cada idioma tiene su propia etimología, lo que afecta las reglas gramaticales. Por ejemplo, en el tailandés, no existen los puntos finales, el árabe se escribe de derecha a izquierda y el alemán tiene pronombres de género neutro. Si se emplea un modelo de aprendizaje automático en inglés para analizar datos multilingües, utilizará las reglas que se aplican a ese idioma y proporcionará información incorrecta. Esto puede dar lugar a campañas de marketing digital y de redes sociales infructuosas o ineficaces que gravan los recursos y disminuyen el rendimiento.