Meta AI lanza un modelo de IA innovador, NLLB-200, el primero en traducir a 200 idiomas con alta calidad
Meta AI ha desarrollado un modelo revolucionario llamado NLLB-200 (No Language Left Behind), capaz de traducir 200 idiomas con una calidad sin precedentes, superando en un 44% el promedio de las tecnologías actuales. Este innovador modelo ha sido sometido a evaluaciones exhaustivas utilizando el nuevo conjunto de datos de evaluación, FLORES-200.
Avances en traducción para todos
NLLB-200 representa un avance significativo en la traducción automática, especialmente para idiomas con pocos recursos que no están bien representados en las herramientas actuales. Con 55 idiomas africanos incluidos y más de 25.000 millones de traducciones diarias en plataformas como Facebook, Instagram y Wikipedia, este modelo abre puertas a miles de millones de personas.
Además, Meta AI ha publicado en código abierto tanto los modelos NLLB-200 como FLORES-200, facilitando que otros investigadores puedan mejorar sus herramientas de traducción y aprovechar esta tecnología avanzada.
Te recomendamos: Google AI ahora incluido en planes Workspace Business y Enterprise
Colaboración con Wikimedia y desafíos técnicos
Meta AI está colaborando con la Fundación Wikimedia para mejorar los sistemas de traducción de Wikipedia. Con más de 300 idiomas presentes en Wikipedia, el modelo NLLB-200 ya se utiliza para traducir artículos a más de 20 idiomas con pocos recursos, ayudando a reducir la disparidad en la cantidad de contenido disponible.
El desarrollo de un modelo único para cientos de lenguas presentó varios desafíos técnicos. Para superar estos obstáculos, Meta AI innovó en la obtención de datos, regularización y aprendizaje curricular, así como en la diversificación de la retrotraducción y uso de redes de mezcla de expertos.
Evaluación y mitigación de riesgos
Para evaluar y mejorar NLLB-200, se diseñó FLORES-200, un conjunto de datos que permite evaluar el rendimiento en más de 40.000 combinaciones lingüísticas. Además, se crearon listas de toxicidad para los 200 idiomas, ayudando a identificar y filtrar contenido potencialmente ofensivo.
Meta AI trabaja con un equipo interdisciplinario de lingüistas, sociólogos y especialistas en ética para garantizar una traducción precisa y culturalmente respetuosa, abordando los riesgos del contenido tóxico y mejorando continuamente el sistema.
Inclusión y futuro del NLLB-200
NLLB-200 tiene el potencial de transformar el mundo digital al proporcionar acceso equitativo a la información y preservar diversas lenguas. Este avance no solo mejora la traducción automática, sino que también abre la puerta a nuevas aplicaciones en el procesamiento de lenguajes naturales, como asistentes virtuales y sistemas de subtitulado multilingües.
Meta AI está comprometida a seguir avanzando en este campo, democratizando el acceso a la tecnología y permitiendo que personas de todo el mundo se conecten y participen en conversaciones en su lengua materna.
Por último, los invitamos a escuchar nuestros podcasts: Top Tech y Top Gaming disponibles en Spotify.