Innovación en Inteligencia para Potenciar las Lenguas con el Proyecto ILENIA

Belén Garmendiaz

El proyecto ILENIA (Impulso de las lenguas en Inteligencia Artificial) es una iniciativa estratégica concebida para potenciar las lenguas cooficiales en el ámbito tecnológico y digital. Con una financiación de 7 millones de euros, esta propuesta se enmarca en la “Estrategia Nacional de Inteligencia Artificial” del Plan de Recuperación, Transformación y Resiliencia, así como en la Agenda España Digital 2026 y el PERTE Nueva economía de la lengua.

El principal objetivo de ILENIA es impulsar la economía digital en España, basada en el lenguaje natural, aprovechando el potencial del español y otras lenguas oficiales para fomentar el crecimiento económico y la competitividad internacional en áreas como la inteligencia artificial, la traducción, la enseñanza, la producción y divulgación cultural, la investigación y la ciencia. ILENIA busca desarrollar recursos multilingües, especialmente en formatos de texto, voz y traducción automática, que respondan a las necesidades actuales de la sociedad y la tecnología.

El proyecto se estructura en torno a cuatro subproyectos: AINA en catalán, NÓS en gallego, GAITU en euskera y VIVES en valenciano, cada uno de los cuales funciona como referencia dentro de sus respectivas lenguas y áreas de influencia. La iniciativa busca crear sinergias entre estos proyectos para multiplicar su impacto social y cumplir con el objetivo estatal de apoyar a las industrias en su transformación digital, liderando el desarrollo e integración de la inteligencia artificial en el tejido productivo, la economía y la sociedad.

Cada subproyecto tiene objetivos específicos:

– AINA: Se centra en la generación de corpus y modelos informáticos de la lengua catalana, facilitando a las empresas la creación de aplicaciones basadas en inteligencia artificial, tales como asistentes de voz, traductores y correctores automáticos, entre otros.

– GAITU: Impulsado por la administración vasca, este proyecto pretende desarrollar servicios lingüísticos de calidad en euskera para ser utilizados en todas las administraciones públicas, mejorando así los servicios ofrecidos a la ciudadanía.

– NÓS: Busca generar los recursos digitales y lingüísticos necesarios para facilitar el desarrollo de aplicaciones basadas en inteligencia artificial y tecnologías del lenguaje en gallego, posicionando esta lengua en la vanguardia tecnológica.

– VIVES: Enfocado en la recopilación de datos de voz y textos, a través de la participación ciudadana y de recursos existentes en la administración pública valenciana, con la finalidad de crear corpus masivos.

El presupuesto de 7 millones de euros se distribuye entre las principales universidades y centros de investigación que actúan como entidades de referencia regional para cada uno de los subproyectos. El Consorcio Barcelona Supercomputing Center-Centro Nacional de Supercomputación (BSC-CNS) coordina ILENIA y lidera NEL-AINA con una financiación de 3 millones de euros. La Universidad de Alicante, a cargo de VIVES, recibe 500.000 euros; la Universidad del País Vasco, responsable de NEL-GAITU, cuenta con 2 millones de euros; y la Universidad de Santiago de Compostela, que lidera NÓS, también tiene asignados 2 millones de euros.

Las ayudas se destinan a dotar estos proyectos de herramientas y recursos básicos, como corpus multimodales, datos anotados, modelos de lenguaje neuronal, motores de traducción y reconocedores del habla, con el fin de que su integración en aplicaciones de inteligencia artificial y tecnologías del lenguaje sea rentable y atractiva tanto para la Administración como para las empresas del sector.

Se espera que la infraestructura lingüística generada por ILENIA permita avances significativos en la digitalización de la Administración pública, facilite la digitalización e internacionalización de empresas, haga más competitiva la industria en este ámbito, y genere nuevos puestos de trabajo cualificados.

El proyecto ILENIA tiene una duración de 36 meses y está coordinado por el BSC-CNS. En la tarea de desarrollo de recursos lingüísticos, trabaja con datos de texto y de voz, generando y actualizando modelos de lenguaje que son esenciales para el desarrollo de nuevas aplicaciones. ILENIA también colabora en la implementación e inclusión de módulos y bibliotecas para las distintas lenguas cooficiales en plataformas de referencia. Los modelos conocidos como Large Language Model (LLM) permiten avanzar rápidamente en la creación de nuevos modelos.

Los datos y metadatos generados por ILENIA están disponibles en la plataforma Hugging Face, y la página web del proyecto está traducida a las cuatro lenguas cooficiales, demostrando así el valor de los modelos de traducción desarrollados.