Asociación Nacional de Empresas de Traducción e Interpretación

  • Inicio
  • ALIA: la inteligencia artificial española

ALIA: la inteligencia artificial española

ALIA: la inteligencia artificial española

La inteligencia artificial ya no es una promesa de futuro, sino una realidad que está redefiniendo economías y sociedades. En este contexto de transformación acelerada, parece que España ha decidido no quedarse al margen ni limitarse a ser un mero consumidor de tecnología desarrollada en otros países. Con la Estrategia de Inteligencia Artificial 2024, el Gobierno ha trazado una hoja de ruta ambiciosa que va mucho más allá de la simple adopción tecnológica: se trata de una visión integral para posicionar a España como actor relevante en el ecosistema global de la IA.

Esta estrategia se articula en torno a tres ejes fundamentales que revelan una arquitectura coherente.

  • El primer eje se centra en reforzar las palancas clave para el desarrollo de la IA: infraestructuras de supercomputación, talento, datos y, especialmente, modelos propios.
  • El segundo eje busca facilitar la expansión de la IA tanto en el sector público como en el privado, con especial atención a las pymes, para evitar una economía de dos velocidades.
  • Por último, el tercer eje apuesta por desarrollar una IA transparente, responsable y humanista, que equilibre el progreso tecnológico con valores éticos y sostenibilidad medioambiental.

Dentro de este marco estratégico, ALIA emerge como una de las iniciativas más audaces y significativas, y se ha convertido en la piedra angular del primer eje: la soberanía digital. ALIA es un ecosistema de modelos fundacionales entrenados con datos en español y en las demás lenguas oficiales (gallego, catalán, valenciano y euskera), diseñado para servir a una comunidad de 600 millones de hispanohablantes.

¿Qué es un modelo fundacional?

Para comprender qué es ALIA, primero es esencial entender qué son los modelos fundacionales y en qué se diferencian de otros tipos de modelos. Un modelo fundacional es un sistema de gran escala entrenado con enormes volúmenes de datos (texto, imágenes, audio y vídeo) en una tarea aparentemente simple: predecir la siguiente palabra en una secuencia de texto. Este proceso permite al modelo adquirir un vasto conocimiento lingüístico y del mundo.

Sin embargo, estos modelos no están diseñados para interactuar directamente con usuarios ni para seguir instrucciones; su valor radica en servir como base o plataforma sobre la que los desarrolladores pueden construir múltiples aplicaciones mediante ajuste fino. Al igual que internet permite crear páginas web o la electricidad da vida a electrodomésticos, un modelo fundacional es la infraestructura fundamental sobre la que se construyen soluciones de IA. En el panorama internacional, encontramos ejemplos comerciales de modelos fundacionales como GPT de OpenAI o LLaMA de Meta.

A partir de estos modelos base, se pueden desarrollar dos tipos de modelos derivados:

  • Por un lado, los modelos instruidos (como salamandra-7b-instruct) son modelos fundacionales que han pasado por una segunda fase de entrenamiento con miles de ejemplos de instrucciones y respuestas deseadas. Este proceso les enseña a comportarse como asistentes: responden preguntas, siguen órdenes y mantienen diálogos coherentes. Son los modelos «listos para usar» que se utilizan para crear chatbots y aplicaciones conversacionales.
  • Por otro lado, los modelos adaptados a tareas específicas han sido ajustados para dominios o funciones particulares, como reconocimiento de entidades (NER), clasificación textual, análisis de sentimientos o anotación morfosintáctica (POS). Estos modelos especializados ofrecen resultados mejores en su campo concreto, aunque sacrifican flexibilidad para otras tareas.

ALIA, en este sentido, no es un modelo único, sino que incluye tanto modelos fundacionales base como modelos derivados ya instruidos y especializados. Por ejemplo, la familia Salamandra, que forma parte del ecosistema ALIA, ofrece no solo modelos base, sino también versiones instruidas y adaptadas a tareas específicas, lo que permite partir de diferentes niveles según las necesidades específicas en cada caso.

Con una inversión de 10,2 millones de euros, ALIA se suma a otros proyectos de IA en España que ya han recibido 15,2 millones de fondos europeos, consolidando así el compromiso con el liderazgo tecnológico.

Por qué es importante ALIA

ALIA se presenta como la primera infraestructura pública europea de inteligencia artificial abierta y multilingüe, un hito pionero en España y en el continente. El proyecto está coordinado por el Barcelona Supercomputing Center-Centro Nacional de Supercomputación, la institución que opera el superordenador MareNostrum 5. Su desarrollo incorpora el español y las demás lenguas oficiales para asegurar soluciones cultural y lingüísticamente adaptadas a la realidad del país.

En lo relativo a la seguridad, los modelos de ALIA estarán sometidos a verificación ante la Agencia Española de Supervisión de la Inteligencia Artificial, con sede en A Coruña, el primer organismo público europeo dedicado a la supervisión de esta tecnología. La agencia velará por el cumplimiento de los estándares de transparencia, seguridad y explicabilidad exigidos por el Reglamento europeo de IA. Bajo la lupa de la AESIA, se busca que los modelos de ALIA no se conviertan en lo que se conoce como «cajas negras» incontrolables. Dicho de otra forma: el objetivo es que los datos de entrenamiento sean trazables, que la documentación de entrenamiento sea accesible y que se adopten medidas para la mitigación de riesgos y sesgos.

Esto incluye tanto sesgos discriminatorios (como aquellos que podrían perpetuar estereotipos de género, étnicos o socioeconómicos en decisiones automatizadas) como sesgos de uso indebido. Por ejemplo, los modelos no deben proporcionar instrucciones detalladas para fabricar armas o explosivos, incitar al suicidio o la autolesión, facilitar actividades delictivas o generar contenido que promueva el odio, la violencia o la desinformación deliberada. Esta supervisión busca garantizar que ALIA sea una tecnología segura, ética y alineada con los valores democráticos europeos.

La iniciativa apuesta por la apertura total. A diferencia de los modelos privados, como GPT-4, Gemini o Claude, se publicarán los pesos completos (es decir, los parámetros internos del modelo que determinan cómo procesa y genera información) y el conjunto de datos de entrenamiento, lo que permitirá auditorías independientes y facilitará la adaptación y mejora por parte de investigadores, universidades y startups. Esto supone una auténtica revolución en este campo, ya que a día de hoy ningún modelo privado es totalmente transparente.

Por último, esta iniciativa persigue reforzar la soberanía tecnológica de España. De este modo, se avanzará hacia una menor dependencia de empresas extranjeras al mismo tiempo que se permite que los investigadores, las universidades y las pymes puedan auditar, mejorar y adaptar los modelos a sus necesidades. Esto, a su vez, se traducirá en una mayor confianza pública y fomentará el desarrollo económico y la innovación local.

Aplicaciones prácticas

Los modelos ALIA ya se han puesto a prueba en dos proyectos piloto del Gobierno de España.

Por una parte, la Agencia Tributaria ha desarrollado un chatbot interno para acelerar gestiones internas y reducir la carga administrativa.

La segunda iniciativa que ya se ha puesto en marcha es una herramienta de diagnóstico precoz de insuficiencias cardíacas en atención primaria. Esta solución tiene por fin mejorar la detección temprana de problemas de salud mediante el análisis de datos clínicos.

Ambas herramientas son una evidencia clara de la importancia de entrenar modelos en nuestras lenguas y dejar de depender de modelos entrenados mayoritariamente en inglés. Si el modelo «piensa» en nuestro idioma, entiende mejor los matices, registros y giros locales.

Vulnerabilidades actuales de ALIA

ALIA es un proyecto muy ambicioso, al que le queda un gran recorrido por delante y muchas aristas por pulir.

A día de hoy, es evidente que su rendimiento no puede competir con el de los modelos comerciales. En este sentido, es vital para el proyecto que cada vez más actores adopten los modelos de ALIA para ir detectando errores y mejorando su desempeño.

Por otra parte, estudios recientes han demostrado que los modelos del ecosistema ALIA aún siguen mostrando sesgos, a pesar de la labor de AESIA. Específicamente, el estudio Red Teaming Contemporary AI Models: Insights from Spanish and Basque Perspectives evaluó a o3-mini (OpenAI), DeepSeek R1 y ALIA Salamandra mediante una metodología de red teaming (una técnica de ciberseguridad que consiste en simular ataques adversariales deliberados para identificar vulnerabilidades) con 670 conversaciones en español y euskera para detectar sesgos y riesgos de seguridad.

El objetivo de este tipo de estudios es someter a los modelos a preguntas y situaciones éticamente complejas o que puedan llegar a ser peligrosas, desde solicitudes que buscan generar contenido discriminatorio, pasando por instrucciones para actividades ilícitas hasta intentos de manipular al modelo para que revele información sensible o genere desinformación. Si bien es cierto que el estudio halló vulnerabilidades en todos los modelos evaluados, Salamandra registró la mayor tasa de respuestas problemáticas; es decir, casos en los que el modelo no logró rechazar adecuadamente solicitudes dañinas, proporcionó información peligrosa o generó contenido con sesgos discriminatorios. Estos resultados subrayan que, aunque ALIA apuesta por la transparencia y la supervisión ética, desarrollar sistemas seguros y libres de sesgos sigue siendo un desafío técnico que requiere mejora continua.

A esto hay que sumarle que mantener, actualizar y auditar ALIA exige una financiación sostenida y elevada, mientras que el uso masivo de datos plantea desafíos de privacidad, como la anonimización, el consentimiento y la gestión de información sensible. Por último, la desigualdad en capacidades técnicas entre usuarios y regiones puede impedir un aprovechamiento equitativo, y ampliar así la brecha digital.

ALIA kit

Como venimos reiterando en este artículo, ALIA no es solo un modelo, sino un ecosistema completo de recursos abiertos que se materializa en el ALIA Kit: una colección organizada de modelos, conjuntos de datos y herramientas pensada para que cualquier persona, empresa o institución pueda desarrollar productos y servicios basados en inteligencia artificial en español y las demás lenguas oficiales.

El contenido abarca todo el ciclo de vida del desarrollo de aplicaciones. Por un lado, incluye modelos de lenguaje tanto fundacionales como instruidos para tareas de texto, habla y traducción automática, junto con los datasets completos utilizados para entrenarlos y evaluarlos. Por otro lado, ofrece herramientas de integración que facilitan su implementación en aplicaciones existentes, lo que reduce la barrera técnica de entrada. Todo esto se complementa con una guía de adopción que recoge información esencial sobre qué familias de modelos existen, cómo utilizarlos, cómo desplegarlos y qué requisitos técnicos necesitan, además de demostradores que muestran ejemplos prácticos en funcionamiento.

Qué queda por hacer

El proyecto ya se ha puesto en marcha y esto supone un hito importantísimo. Sin embargo, para que no se quede solo en un esfuerzo simbólico, hará falta dotarlo de financiación, una hoja de ruta pública y evaluaciones independientes. Además, será fundamental priorizar la calidad en todas las lenguas oficiales y acompañarlo de capacitación e infraestructura para que administraciones, empresas y ciudadanía puedan aprovecharlo de forma equitativa y medible.

Imagen de Antonio Leal Fernández

Antonio Leal Fernández

Soy Language Solutions and Technology Manager en Globalingua.
Me licencié en Traducción e Interpretación en la Universidad de Vigo y llevo más de 10 años en el sector de la traducción, la localización y la gestión de proyectos lingüísticos.
Me encantan la tecnología y los idiomas. Me apasiona la época de cambios en la que vivimos y la infinidad de aplicaciones prácticas que surgen cada día para mejorar la forma en que trabajamos, nos comunicamos y entendemos el mundo.

Imagen de Nuria Castro

Nuria Castro

Soy cofundadora y directora de Globalingua.

Mi trayectoria combina la pasión por los idiomas con una visión estratégica centrada en el desarrollo empresarial. Me licencié en Traducción e Interpretación por la Universidade de Vigo y cursé un máster en Estudios Europeos en la Université Libre de Bruxelles.

Soy secretaria general de ANETI desde mayo de 2025 y formo parte del comité ELIA Exchange.

Me motiva especialmente el emprendimiento, la innovación y todo lo que une lenguas, tecnología y estrategia. Disfruto desarrollando soluciones a medida, resolviendo desafíos de comunicación y acompañando a las empresas en su crecimiento internacional.

Noticias relacionadas