Google Translate se actualiza con 110 idiomas nuevos, incluyendo dialectos y lenguas antiguas

Google Translate se actualiza con nuevos idiomas
photo_camera Google Translate se actualiza con nuevos idiomas

Este jueves, Google anunció que incorporó a su herramienta de traducción (Google Translate) más de 110 idiomas, incluyendo dialectos y lenguas de Latinoamérica, como el K’iche’ y el Ta Yol Mam (Guatemala y México); el Náhuatl o Nahua, Maya, y el Zapoteco (México); el Q’eqchi (México y Belice); y el Hunsrik (Brasil).

Además de estos dialectos y lenguas de Latinoamérica, Google también agregó idiomas de otras partes del mundo, como el cantonés y el punjabi. De hecho, según la compañía, aproximadamente una cuarta parte de los nuevos idiomas disponibles en Google Translate provienen de África, lo que representa su mayor expansión de idiomas africanos hasta la fecha, incluidos fon, kikongo, luo, ga, swati, venda y wolof.

De acuerdo con Google, este es el lanzamiento más grande en Translate hasta el momento, ya que los idiomas recientemente incorporados representan a más de 614 millones de hablantes en conjunto, permitiendo traducciones para alrededor del 8% de la población mundial.

Para probar esta nueva función, basta con entrar al sitio de Google Translate desde tu ordenador o a través de las aplicaciones para Android e iOS. Google aclaró que la implementación de estos nuevos idiomas se hará de manera gradual entre el 27 de junio y el 7 de julio.

Este reciente anuncio forma parte de la 'Iniciativa 1,000 Idiomas' que Google presentó en 2022. Este es básicamente un compromiso de la compañía para construir modelos de IA que admitan los 1,000 idiomas más hablados en todo el mundo.

En 2022, la compañía agregó 24 nuevos idiomas utilizando Zero-Shot Machine Translation, donde un modelo de aprendizaje automático aprende a traducir a otro idioma sin siquiera ver un ejemplo. De acuerdo con Google, esta tecnología facilita y agiliza el proceso de incorporación de nuevos lenguajes para llegar a cada vez más comunidades.

Los idiomas tienen una enorme cantidad de variaciones: variedades regionales, dialectos y diferentes reglas de ortografía. De hecho, muchos idiomas no tienen una norma única, por lo que es imposible elegir una variedad “correcta”. Frente a ello, el enfoque de Google ha sido priorizar las variedades más utilizadas de cada idioma.

Por ejemplo, el romaní es un idioma con muchos dialectos en toda Europa, pero sus modelos de IA generan texto lo más parecido posible al romaní vacalo (o vlax) del sur, una variedad comúnmente utilizada en internet. Sin embargo, también mezcla elementos de otros, como el romaní valaco del norte y el romaní balcánico.

Comentarios