Jue. Feb 2nd, 2023

MADRID, 19 (SERVIMEDIA)

Victoria Mingote, investigadora del Instituto de Investigación en Ingeniería de Aragón (I3A), recibió el ‘Premio IberSpeech 2022’ a la mejor tesis y el premio de la Red Temática de Tecnologías del Habla al mejor artículo publicado en la revista ‘IEEE/ACM Transactions on Audio Speech and Language’ por un trabajo que abre nuevas líneas de investigación como la utilización de técnicas de Inteligencia Artificial para reconocer el rostro y la voz, según publicó este lunes el I3A.

Mingote forma parte del grupo de investigación ViVoLab, cuyas líneas de trabajo son las tecnologías del habla, del lenguaje y el aprendizaje automático. «Estas técnicas funcionan ya bastante bien cuando hay muchos datos preparados previamente para que el sistema aprenda a quien debe permitir el acceso». Pero aun así hay muchos desafíos a los que enfrentarse en este tipo de sistemas», explicó la investigadora en un comunicado.

Uno de los retos a los que se enfrenten la ciencia es a que etas máquinas sean capaces de diferencia distintas voces. «Si se intentan usar las habituales grandes redes neuronales cuando se cuenta con pocos datos adecuados para el sistema va a ser imposible diferenciar entre varias personas hablando», señaló Mingote.

En este campo es en el que ha profundizado la joven galardonada «para encontrar soluciones adaptadas a estas situaciones. Lo que ha permitido el desarrollo de técnicas capaces de diferenciar bastante bien quienes son las personas que están hablando», comentó la investigadora del grupo ViVoLab.

De otro lado, también se planteó la siguiente pregunta: ¿Qué sucede en el otro cuando se dispone de demasiados datos? «Es bueno sí, pero solo si están adecuadamente preparados y controlados para poder usarlos», aclaró.

La tesis doctoral premiada aborda esta situación y contempla el desarrollo de sistemas de reconocimiento conjunto de voz y cara conjuntamente que ayuden a analizar y catalogar el contenido.