Google Translatotron traduce el habla directamente al habla

Google ha anunciado Translatotron, un “nuevo sistema experimental” que, según la empresa, puede traducir el lenguaje hablado directamente a lenguaje hablado.

“Translatotron es el primer modelo de punta a punta que puede traducir directamente el habla de una lenguaje al habla en otro lenguaje”, según un blog publicado en Google AI el miércoles 15 de mayo.

Google dijo que los sistemas de traducción de la actualidad cuentan con tres fases: reconocimiento automático del habla, que transcribe el lenguaje hablado a texto; traducción de máquinas, que traduce un texto a otro idioma; y síntesis de texto a habla, que usa texto para generar habla.
El graduar estos pasos ha llevado a servicios como Google Translate, pero la gigante de tecnología ahora dice que ahora usará un modelo sin la necesidad de texto”.

“Conocido como Translatotron, este sistema evita dividir la tarea en dos fases separadas”, dice el blog escrito por los ingenieros de Google AI Ye Jia y Ron Weiss.

Esto significaría mayor velocidad de traducción y menos errores, según Google.

El sistema utiliza espectogramas como entradas y genera espectogramas, dependiendo también en un vocoder neural (o sintetizador de habla) y un codificador del habla. Esto significa que el sistema conserva las características vocales del hablante una vez se traduce lo hablado.