Translatotron: el “robot” de Google que puede traducir en directo la voz a otro idioma, sin usar textoTecnología 

Translatotron: el “robot” de Google que puede traducir en directo la voz a otro idioma, sin usar texto

Google asegura haber creado un nuevo sistema de traducción, conocido como Translatotron, en el que a través de mecanismos de Inteligencia Artificial (IA) es capaz de traducir la voz de un idioma a otro directamente, sin necesidad de realizar ninguna conversión a texto.

La unidad especializada en Inteligencia Artificial del gigante de Mountain View, California, anunció este nuevo sistema, que propone un nuevo modelo alternativo de secuencia a secuencia con el que se elimina la necesidad de representar texto intermedio en una traducción.

Mirá también

Newsletters Clarín

Lo más leído del día | Enterate de que se habló hoy para no quedarte afuera del mundo

De lunes a viernes por la tarde.

Recibir newsletter

El funcionamiento de Translatotron se basa en un solo proceso, en lugar de dividirlo en distintas fases como sucede en los sistemas de traducción actuales, que se apoyan en mecanismos de síntesis de voz a texto.

Con este sistema, los investigadores aseguran que pueden lograr una velocidad de traducción más rápida, en la que se evitan los errores del proceso de reconocimiento de habla y traducción, “reteniendo directamente la voz original del hablante después de la traducción”.

Mirá también

De esta manera, según detalla Google en su blog oficial, logra también alcanzar una mejor gestión gestión de las palabras que no se traducen, como los nombres propios.

Cómo funciona Translatotron

El sistema de Google utiliza como fuente espectogramas con la señal de voz captada y genera otros línea de voz en el idioma elegido para la traducción. También emplea un codificador de voz neuronal que convierte el espectograma resultante en ondas de audio con referencias de tiempo.

Mirá también

Además, puede añadirse un mecanismo adicional que aprende las características del habla de una persona y que las codifica para lograr mantener su tono de voz, para utilizarlo posteriormente en la sintetización de la traducción de voz.

En todo el proceso, la Inteligencia Artificial de Google utiliza objetivos multitarea para predecir los movimientos de la fuente, al mismo tiempo que genera los espectogramas de la traducción.

Fuente: DPA

Articulos relacionados