Super Mensajes

Tal parece que Meta quiere acabar con el reinado de Google Translator y ha diseñado un ambicioso plan para hacerlo. La compañía matriz de Facebook, Instagram y WhatsApp ha presentado “No Language Left Behind-200” (NLLB-200 o “Ningún idioma quedará olvidado” por su traducción al español),un traductor en tiempo real basado en inteligencia artificial que contará con soporte para 200 idiomas.

Tal como detalló en su blog oficial, la compañía quiere desarrollar una plataforma que contemple una gran cantidad de idiomas, incluyendo algunos que no han sido tomados en cuenta por otras herramientas hasta la fecha. El NLLB-200 tendrá soporte en 40.000 direcciones distintas gracias a las combinaciones de los 200 idiomas que podrá traducir, dejando atrás los 133 que soporta Google Translator.

En esta ecuación, se incluyen idiomas que no son tan habituales en plataformas de traducción conocidos como "idiomas de escasos recursos", hablados por un grupo reducido de personas en el mundo o que tienen menos de un millón de frases disponibles con las que entrenar a la IA. Por ejemplo, se menciona que algunas lenguas de la India o África también tendrán frases traducidas en el sistema.

La inteligencia artificial como medio para traducir

Un estudio científico conducido por Meta explica con mayor detalle cómo viene siendo desarrollada esta nueva plataforma de traducción en tiempo real. Según el documento, la compañía ha combinado su Meta AI, un sistema de validación humana para traducción llamado FLORES-200 y mecanismos para crear frases de entrenamiento con la intención de mejorar al traductor y sus resultados.

Para obtener una traducción decente u óptima, Meta creó una base de datos de prueba con 3001 pares de frases en cada uno de los idiomas que soporta su plataforma. Cada una de estas se tradujo del inglés al idioma destino gracias a un equipo de traductores profesionales humanos que además hablan dicho idioma de forma nativa.

Basándose en estos resultados, se comenzó a comparar la traducción automática con las referencias humanas usando el BiLingual Evaluation Understudy (BLEU), un benchmark bastante popular en lo que a traducciones se refiere. La prueba fue muy alentadora ya que el modelo de Meta fue considerado un 44% más acertado que el de los mejores sistemas automáticos de traducción que existen en la actualidad.

No obstante, esto no quiere decir que todas las traducciones bajo este sistema sean infalibles ya que, por ejemplo, es más difícil determinar errores en los idiomas con pocos recursos por lo que los resultados en dichos casos deberán ser tomados con una perspectiva distinta. Además, el integrar listas de toxicidad para detectar y evitar groseríaso contenido potencialmente ofensivo también es importante.

Meta traductor
Las pruebas arrojaron que el sistema de Meta es un 44% más eficaz que el de los mejores traductores en tiempo real de la actualidad. | Fuente: Meta

Un traductor en el que todos pueden contribuir

Meta señaló que NLLB es un proyecto Open Source por lo que su código está abierto al público en general y hasta se publicarán las herramientas de investigación utilizadas para su desarrollo. Esto quiere decir que, gracias al trabajo de la comunidad en Internet, más idiomas podrían integrarse y hasta las traducciones podrían ser más acertadas en el futuro.

Por último, Meta anunció su asociación con Wikimedia Foundation, la fundación de Wikipedia, para apoyar los sistemas de traducción de la gran enciclopedia de Internet. El objetivo de NLLB es que más contenido disponible en la red pueda ser entendido por las personas incluso si no manejan el idioma en el que están escritos.

Actualmente, existe una demostración de cómo funciona este sistema y puede ser explorado a través del siguiente enlace. No obstante, aún no se tiene una fecha exacta de su lanzamiento.

Te recomendamos METADATA, el podcast de tecnología de RPP. Noticias, análisis, reseñas, recomendaciones y todo lo que debes saber sobre el mundo tecnológico. Para escucharlo mejor, #QuedateEnCasa.