Contexto

El avance tecnológico genera bienestar y soluciones pero conlleva la aparición de nuevas demandas y posibilidades. La Inteligencia Artificial está cada vez más presente en nuestras vidas y precisa de mecanismos que permitan a las máquinas adquirir el conocimiento suficiente para poder interactuar con los humanos.

Desde mediados de los años 90 se ha puesto un especial interés en el reconocimiento de emociones analizando voz, lenguaje, cara, gestos o ECG. Estas disciplinas requieren conjuntos de datos supervisados definidos por un número variable de características y de etiquetas emocionales proporcionadas por anotadores expertos o por un conjunto de anotadores inexpertos a través del crowdsourcing.

El reconocimiento de emociones en el habla debe estar enfocado en el análisis de la señal acústica de la voz extrayendo características de señales de excitación debido a la componente no lineal del flujo de aire en el tracto vocal, características del tracto vocal como los formantes, características prosódicas como la sonoridad del pitch, la velocidad de locución, el ritmo, la calidad de la voz y la articulación, latencia del habla, pausas, características derivadas de la energía, así como combinaciones de ellas.

Además, hay que tener en cuenta que las emociones implican subjetividad tanto en la forma de expresarlas como en el reconocimiento de las mismas por los anotadores debido a factores culturales y situaciones específicas. Por ello, es de suma importancia el uso de grabaciones reales (no simuladas o actuadas) y el diseño de un proceso adecuado de etiquetado que genere resultados equivalentes al proceso real de identificación de emociones por un ser humano.

Objetivos

XUPERA tiene un objetivo claro: mejorar los procesos y servicios de los clientes. Por ello, investiga y hace uso de las nuevas tecnologías de Machine Learning ligadas al campo de la Inteligencia Artificial que permiten explotar los datos almacenados o Big Data y encontrar así, patrones repetitivos que permitan abordar los problemas y explorar nuevas soluciones. Trabajar y desarrollar sistemas de Speech Analytics permite extraer información analizando el conjunto de las grabaciones almacenadas en los sistemas de grabación, haciendo un reconocimiento del habla y centrando la detección de estados emocionales como objetivo principal y primordial.

Para este objetivo ha colaborado con el grupo de investigación “Speech Interactive Research Group (SPIN)” de la Universidad del País vasco, que cuenta con extensa experiencia adquirida en el análisis de señales de voz y detecciones de emociones en voz y habla entre otras.

Aprendizajes

Gracias a esta colaboración se obtuvieron los siguientes resultados:

  • 2 tesis investigación
  • 1 paper: Analyzing the expression of annoyance during phone
    calls to complaint services
  • 1 presentación en 7th IEEE International Conference on Cognitive Infocommunications (CogInfoCom 2016) en Wrocław, Polonia.

En este proyecto, se ha identificado la necesidad de contar con una herramienta automática capaz de detectar variaciones emocionales en conversaciones telefónicas. Esta herramienta debe facilitar la detección de emociones en conversaciones reales de un Call Center con el fin de analizarlas a posteriori y comprobar la política y el modo de actuación de los operadores frente a los estados emocionales experimentados por los clientes.

En un primer lugar, se deben preparar los datos. Para ello, se debe conformar un diseño adecuado de etiquetado que permita categorizar los datos de una manera realista y objetiva. Estos datos serán etiquetados por un grupo de expertos de XUPERA y mediante crowdsourcing gracias a una plataforma desarrollada por el grupo SPIN. Creando así, un corpus de gran notoriedad, inédito y de gran interés cientifico debido en gran parte al uso de conversaciones reales y no simuladas.

Posteriormente, se debe realizar un procesado de los datos en el que se llevará a cabo la extracción de las características de las diferentes señales de voz analizadas. En este punto, investigaremos en nuevas características que puedan ser de gran utilidad en la detección de emociones. Todo ello, estará acompañado paralelamente de un desarrollo formal de modelos y formulaciones utilizando clasificadores geométricos y redes neuronales que nos permitirán evaluar la calidad de nuestro conjunto de datos y buscar soluciones a nuestro objetivo gracias al reconocimiento de patrones. En este apartado se entrenarán, testearán y afinarán los diferentes modelos que se harán uso en la ejecución de la herramienta implementada.

Finalmente, se propone desarrollar una aplicación gráfica y funcional que incorpore las diferentes herramientas desarrolladas. Esta herramienta facilitará la comunicación entre el cliente y el operador permitiendo que este último adecúe la interlocución a las necesidades del cliente, conduciéndolo a un estado de conformidad y resolviendo los problemas gracias a las indicaciones del sistema desarrollado.

Para acceder al paper "Analyzing the expression of annoyance during phonecalls to complaint services"

Creación Nuevos Productos

Creación nuevos productos

ChatBOTS

ChatBOTS

New Users

Social Share

Newsletter Registration

Dirección del Proyecto 90%
Gestión y Coordinación del proyecto 90%
Revisión del Estado del Arte 100%
Especificación funcional del Sistema 100%
Diseño de la Arquitectura genérica 100%
Definición de los escenarios de aplicación 100%
Definición de objetivos e indicadores de logro 100%
Motor semántico 50%
Dominio de conocimiento 50%
Módulo de administración 50%
Vigilancia Tecnológica continua 50%