Buenos Aires (AT) – El modelo de lenguaje Teuken-7B, creado por OpenGPT-X, marca un hito en el desarrollo de inteligencia artificial (IA) en Europa. Este proyecto busca posicionar a la región en un mercado dominado por gigantes estadounidenses, priorizando valores como la privacidad, la accesibilidad y la inclusión lingüística.
Desde su lanzamiento en 2022, el proyecto OpenGPT-X se centró en desarrollar un modelo de lenguaje que refleje los valores europeos. A diferencia de otros desarrollos internacionales, como GPT-4 de OpenAI o Gemini de Google, Teuken-7B fue entrenado con datos en los 24 idiomas oficiales de la Unión Europea y cuenta con siete mil millones de parámetros.
El director del Instituto Fraunhofer para Sistemas de Análisis de Información Inteligente (IAIS), Stefan Wrobel, destacó: “Nuestro modelo ha demostrado su capacidad en una amplia variedad de idiomas. Esperamos que muchas personas lo adapten para sus propios trabajos y aplicaciones”.
El enfoque multilingüe de Teuken-7B incluye aproximadamente un 50 % de datos en idiomas distintos al inglés, garantizando estabilidad y confiabilidad en lenguas complejas como alemán, finés y húngaro. Esto resulta especialmente valioso para empresas con necesidades de comunicación internacional.
Código abierto: acceso global para investigación y empresas
Teuken-7B está disponible de forma gratuita a través de la plataforma Hugging Face, bajo dos versiones: una para investigación y otra con licencia comercial Apache 2.0. Esto permite que tanto científicos como empresas integren el modelo en aplicaciones prácticas sin renunciar al control sobre sus datos sensibles.
“El modelo ofrece una alternativa proveniente de la investigación pública, lo que fomenta la transparencia y la personalización en la inteligencia artificial generativa”, afirmó Daniel Abbou, director del KI Bundesverband y presidente del European AI Forum.
Además, Teuken-7B fue optimizado para tareas de interacción, como chats, gracias a la técnica de “Instruction Tuning”, que mejora su comprensión de las instrucciones dadas por los usuarios.
Eficiencia energética y sostenibilidad en el desarrollo
Un aspecto destacado del proyecto OpenGPT-X es su compromiso con la eficiencia energética y la reducción de costos operativos. Para ello, el equipo desarrolló un “tokenizador” multilingüe que minimiza el número de fragmentos lingüísticos procesados por el modelo, logrando un entrenamiento más rápido y económico en comparación con otras alternativas como Llama3 o Mistral.
El superordenador JUWELS, ubicado en el Centro de Investigación de Jülich en Alemania, fue clave para entrenar Teuken-7B. Este desarrollo no solo beneficia al modelo actual, sino que sienta las bases para futuros proyectos en la región.
Impulso para la soberanía tecnológica europea
El proyecto, financiado por el Ministerio Federal de Economía y Protección del Clima de Alemania (BMWK), busca fortalecer la soberanía tecnológica de Europa. La infraestructura de Teuken-7B también es compatible con Gaia-X, un sistema federado que permite compartir datos entre empresas y organizaciones bajo estrictas condiciones de privacidad.
“La tecnología desarrollada en OpenGPT-X demuestra cómo los fondos públicos pueden generar soluciones tecnológicas valiosas, promoviendo la independencia tecnológica de Europa frente a los grandes actores globales”, señaló Abbou.
Un modelo adaptado a la diversidad global
A diferencia de los modelos dominantes en la industria, Teuken-7B prioriza una representación justa de las lenguas europeas, abarcando tanto lenguas mayoritarias como minoritarias. Esta característica resulta especialmente útil para empresas que operan en múltiples mercados y requieren soluciones lingüísticas específicas.
El modelo ya ha despertado interés entre investigadores y empresas de sectores como telecomunicaciones, medios y finanzas, quienes pueden integrarlo en aplicaciones personalizadas que respeten los estándares de privacidad europeos.
Aunque Teuken-7B está lejos de igualar los 200.000 millones de parámetros de GPT-4 de OpenAI, su carácter multilingüe y de código abierto lo convierte en una herramienta única en su tipo. Su lanzamiento refuerza el posicionamiento de Europa en el ámbito de la inteligencia artificial, compitiendo con modelos de empresas como Meta, Anthropic y Google.
Una mirada al futuro
El desarrollo de Teuken-7B no solo representa un avance tecnológico, sino también un compromiso con la ética y la sostenibilidad en la inteligencia artificial. Su disponibilidad gratuita y adaptable refuerza la colaboración entre la comunidad científica y la industria, marcando el camino hacia soluciones más inclusivas y respetuosas con los valores europeos.
Este modelo pone de manifiesto que Europa puede liderar la innovación tecnológica sin renunciar a sus principios, abriendo nuevas oportunidades para investigadores y empresas en un mercado cada vez más competitivo.
Hacé tu comentario