Amazon va mejorando la capacidad de Alexa de adaptar su voz a situaciones concretas, y si para la versión en inglés ya es capaz de susurrar a través de los Echo, desde esta semana será capaz de hablar con una entonación de  “presentador de noticias”. Cuando los propietarios de estos altavoces inteligentes en EEUU le preguntan a Alexa “what’s the latest?” para escuchar las noticias del día, Alexa responde ya con una voz similar a la de un presentador profesional de informativos. La tecnología detrás de Alexa sabe qué palabras deben enfatizarse para una lectura más realista de las noticias, explica Amazon.

Para lograr esta nueva voz, según ha publicado Techcrunh, Amazon aprovechó los desarrollos recientes que realizó con la tecnología Neural TTS o NTTS. Esta tecnología ofrece una voz con un sonido más natural y le permite a Alexa adaptar su estilo de habla según el contexto de su solicitud. Para la voz del locutor, el uso de NTTS produjo un discurso con mejor entonación, que enfatiza las palabras correctas en una oración, dice Amazon.

Además, los científicos de Amazon utilizaron un enfoque llamado “modelado de forma de onda directa” que usa el “deep learning” para producir la señal del habla.

La compañía había detallado esta tecnología en noviembre y dijo que en ese momento su último sistema de conversión de texto a voz podría ser entrenado para usar el estilo de presentador de noticias después de unas pocas horas de datos de capacitación. Los investigadores señalaron que el desarrollo podría allanar el camino para que Alexa y otros servicios adopten diferentes estilos de habla para otros contextos en el futuro.

“La capacidad de enseñar a Alexa a adaptar su estilo de habla en función del contexto de la solicitud del cliente abre la posibilidad de ofrecer experiencias nuevas que antes eran impensables”, dijo Andrew Breen, gerente senior del equipo de investigación TTS en Amazon, en una declaración. “Estamos encantados de que nuestros clientes escuchen las noticias de esta nueva manera”.

Más sencillo para ser usado por medios sin capacidad para grabar sus resúmenes

La decisión de Amazon responde al importante uso que muchos de los que han adquirido estos altavoces inteligentes les están dando. Escuchar noticias, mediante las “skills” que han ido creando los medios de comunicación, es uno de los usos preferidos. La mayor parte de las rutinas que se programan con Alexa al empezar el día incorporan una o varias lecturas de lo más destacado del día, pero no todos los medios de comunicación tienen la capacidad de grabar estos miniinformativos. Esta nueva funcionalidad de Alexa permitiría que sencillamente con un resumen escrito, Alexa sea capaz de leerlo.

Deja un comentario