La futura IA de las lenguas de España

Como ya he comentado en otras ocasiones, tengo un especial interés por todo lo que se refiere al uso de modelos de inteligencia artificial en las Administraciones públicas. Creo que la Administración tiene capacidad y la obligación de liderar este tipo de transformaciones que pueden suponer no solo mayor eficiencia, sino también la mejora de los servicios que se ofrecen a los ciudadanos.
De acuerdo con la información facilitada en la página web de La Moncloa el pasado 5 de abril, Pedro Sánchez, acompañado por el Ministro para la Transformación Digital y de la Función Pública, José Luis Escrivá, se ha reunido con Darío Gil, Vicepresidente senior de IBM y director de IBM Research.
En el encuentro se ha hablado del acuerdo al que han llegado el Gobierno de España e IBM para desarrollar modelos fundacionales de Inteligencia Artificial, basados en el español y las lenguas cooficiales.
Ejes estratégicos
El Memorando de Entendimiento que se ha firmado se articula en torno a cinco ejes estratégicos:
- Promover el desarrollo de un conjunto de modelos fundamentales, incluyendo tanto modelos de lenguaje grandes (MLLs) como modelos de lenguaje pequeños (MLPs), competentes en el idioma español y las lenguas cooficiales.
- Colaborar en la investigación y desarrollo de una plataforma completa de IA generativa, incluyendo software basado en marcos y herramientas de código abierto, así como infraestructura que permita la diversidad de hardware.
- Fomentar estrategias nacionales y regionales de IA a través de un enfoque cooperativo que promueva el uso responsable de los modelos fundamentales y de la plataforma de IA generativa asociada. Este esfuerzo colaborativo tiene como objetivo beneficiar al sector público y a las PYMES en toda España.
- Fomentar un ecosistema de creadores y constructores de IA, utilizando los activos desarrollados a través de esta colaboración, para establecer a España como líder mundial en IA.
- Desarrollar técnicas mejoradas por IA para acelerar el descubrimiento, desarrollo y validación de nuevos materiales para avanzar en la sostenibilidad de la cadena de valor de la industria de semiconductores.
Barcelona Supercomputing Center
Otro de los puntos destacados del encuentro ha sido la incidencia puesta en el papel que tendrá el Barcelona Supercomputing Center. A este respecto, el Ministro Escrivá se ha comprometido a seguir invirtiendo para conseguir el paso de Mare Nostrum 5 a Mare Nostrum 6, inversión necesaria para llevar a buen fin el desarrollo de modelos, dados los inmensos requerimientos de computación para el entrenamiento de estos modelos.
Se ha señalado también que uno de los puntos esenciales de los planes para los futuros modelos será la utilización para el entrenamiento tanto de datos públicos como de otros propiedad del Estado, como la transcripción de los debates parlamentarios, y se contará además con la colaboración de las bibliotecas nacionales y de la Real Academia Española.
El proyecto Alia
De acuerdo con Darío Gil, IBM ha previsto tener algo preparado a lo largo de este año, de forma que todos podremos experimentar con el nuevo modelo, de naturaleza abierta. Más precisamente, el plan consiste en hacerlo público después del verano, con lo que no tendremos que esperar demasiado para ponerle las manos encima.
Enlaces
- El Gobierno colaborará con IBM para desarrollar modelos de lenguaje de Inteligencia Artificial en español y lenguas cooficiales
- Darío Gil, IBM Research: “Este año estará el primer modelo de inteligencia artificial en español con casos de uso”
- IBM and The Government of Spain Collaborate to Advance National AI Strategy and Build the World’s Leading Spanish Language AI Models
- El proyecto Alia, el ‘ChatGPT español’ que entrena el Gobierno: “La calidad de las respuestas va a ser mucho mejor”