Introducción
El informe Draghi, encargado por el Consejo Europeo al ex primer ministro italiano, propone un camino a seguir para mejorar la competitividad en la Unión. Sigue al informe Letta sobre el mercado interior de la Unión, que habíamos analizado en un artículo anterior.
Enrico Letta recomienda introducir una quinta libertad además de la libre circulación de bienes, servicios, personas y capitales, ya que estas últimas no permiten «pasar de una economía basada en la propiedad a una nueva economía basada en el acceso y el intercambio». Por lo tanto, debería consagrarse la libertad de circulación y el intercambio de investigación, innovación, datos y conocimientos para estas dimensiones, que se han convertido en motores indispensables de la innovación en las economías modernas.
En este estudio no abordaremos la política de inversión ni las recomendaciones de Mario Draghi para un mercado de capitales integrado, sino que nos centraremos en la estrategia de innovación propuesta, tal y como se explica en la parte B del informe, que incluye un análisis en profundidad y recomendaciones tanto sobre políticas sectoriales como horizontales. Apoyamos la idea de promover el lanzamiento explícito de una segunda temporada de la estrategia europea de datos tal y como se presentó inicialmente en febrero de 2020. Una Unión de Datos aprovechará el marco regulatorio y las inversiones en los espacios comunes europeos de datos y facilitará la quinta libertad defendida por Enrico Letta sobre la competitividad de la IA.
El intercambio de datos en los ecosistemas de los diez sectores estratégicos propuestos por Mario Draghi es la condición previa para cualquier aplicación útil de la IA en estos sectores.
Los impresionantes avances de la IA generativa no podrán alcanzar su potencial global sin el acceso a datos de calidad obtenidos con el consentimiento de los titulares de los datos. Por otra parte, los modelos de IA de código abierto como el R1 de DeepSeek pueden considerarse un «momento Sputnik» 1 y muestran que la competencia global en IA está lejos de haber terminado. Un equipo de 200 ingenieros parece ser capaz de desarrollar un modelo de IA más respetuoso con el medio ambiente y que responda a las expectativas formuladas en el informe Draghi. Este enfoque, desplegado en Europa, sería sin duda preferible al basado en la «fuerza bruta» anunciada por Donald Trump a través de los 500.000 millones de dólares al consorcio Stargate una semana antes 2.
En primer lugar, resumiremos la posición del informe Draghi sobre el intercambio de datos, mostrando que no lo reconoce como una condición previa indispensable para el «Plan de prioridades de la Unión Europea en materia de IA vertical». Luego, presentaremos la cadena de valor del intercambio de datos como base de una ventaja competitiva gracias a la IA, y luego ofreceremos una visión general de las iniciativas existentes en materia de intercambio de datos en Europa. Por último, explicaremos cómo aprovechar las inversiones europeas en materia de intercambio de datos para apoyar el Plan de Prioridades de IA Vertical.
El intercambio de datos en el informe Draghi
El informe Draghi consta de dos partes: el informe en sí (parte A) y las recomendaciones (parte B).
La parte A se centra en el análisis de la brecha de productividad entre la Unión y Estados Unidos:
El principal motor de la creciente brecha de productividad entre la Unión y Estados Unidos ha sido la tecnología digital, y Europa parece estar dispuesta a quedarse atrás.
El ejemplo clave de la brecha de productividad se ilustra con la referencia a la IA:
Europa va a la zaga en lo que respecta a las tecnologías digitales disruptivas que impulsarán el crecimiento en el futuro. Alrededor del 70 % de los modelos de IA fundacionales se han desarrollado en Estados Unidos desde 2017 y sólo tres hiperescaladores representan más del 65 % del mercado mundial y europeo de la nube […]. La desventaja competitiva de la Unión probablemente se agravará en el ámbito de la nube, ya que el mercado se caracteriza por continuas inversiones masivas, economías de escala y múltiples servicios ofrecidos por un único proveedor. Sin embargo, hay muchas razones por las que Europa no debe renunciar a desarrollar su sector tecnológico. En primer lugar, es importante que las empresas de la Unión mantengan un pie en los ámbitos en los que se necesita soberanía tecnológica, como la seguridad y la encriptación (soluciones soberanas de la nube). En segundo lugar, un sector tecnológico débil obstaculizará el rendimiento en materia de innovación en una amplia gama de ámbitos adyacentes, como la farmacia, la energía, los materiales y la defensa. En tercer lugar, la IA es una tecnología en evolución en la que las empresas de la Unión aún tienen la oportunidad de hacerse un hueco en algunos segmentos.
Más adelante en el informe, el intercambio de datos se menciona como una de las principales recomendaciones:
La Unión debería promover la coordinación intersectorial y el intercambio de datos para acelerar la integración de la IA en la industria europea… Para facilitar esta cooperación, se debería animar a las empresas de la Unión a participar en el «Plan de prioridades de IA vertical». El objetivo de este plan sería acelerar diez sectores estratégicos en los que los modelos de negocio de la Unión se beneficiarán más de la rápida introducción de la IA (automóvil, fabricación avanzada y robótica, energía, telecomunicaciones, agricultura, aeroespacial, defensa, previsión medioambiental, farmacia y salud) […]. En particular, para paliar la falta de grandes conjuntos de datos de la Unión, el entrenamiento de los modelos debería alimentarse con datos proporcionados libremente por varias empresas de la Unión dentro de un determinado sector.
Por último, se menciona la importancia de la informática desmaterializada para el intercambio de datos y la forma de aprovechar los avances estadounidenses:
Dada la dominación de los proveedores estadounidenses, la Unión debe encontrar un equilibrio entre la promoción de su industria nacional de la nube y la garantía de acceso a las tecnologías que necesita.
La parte B del informe Draghi describe el estado actual de la «digitalización y las tecnologías avanzadas» en la Unión:
El modelo industrial de la Unión, basado hasta ahora en la importación de tecnologías avanzadas y la exportación de los sectores del automóvil, la mecánica de precisión, la química, los materiales y la moda, no refleja el ritmo actual de la evolución tecnológica.
La Unión adolece de una capacidad limitada para aprovechar la dinámica de que los ganadores se llevan la mayor parte, los efectos de red y las economías de escala en las tecnologías clave, con la excepción de los materiales de nueva generación y las tecnologías limpias.
A lo largo del tiempo se han creado varias alianzas industriales de la Unión para tecnologías basadas en la nube y el intercambio de datos con diversos cometidos (Andrómeda, Gaia-X, Catena-X), pero los resultados hasta la fecha son mínimos.
Más recientemente, varios Estados miembros han fomentado la creación de sistemas «seguros» en los que los proveedores de infraestructura como servicio pertenecientes a la Unión cooperen con los distribuidores de hiperescaladores, manteniendo al mismo tiempo el control de los elementos sensibles de seguridad y cifrado (soluciones de «nube soberana»).
La segunda serie de recomendaciones es esencial para cerrar la brecha de productividad y promover el uso de la IA en 10 industrias estratégicas:
Poner en marcha un «Plan de prioridades de la Unión en materia de IA vertical». En el marco de estas prioridades, el plan financiaría modelos verticales clave de IA en los sectores industriales, basados en el intercambio de datos de la Unión, al amparo de la aplicación de las normas antimonopolio para diez industrias estratégicas en las que deben protegerse los conocimientos técnicos europeos y la captura de valor: 1) la industria automotriz y la plataforma de movilidad; 2) la industria de vanguardia y la robótica; 3) la energía —para la optimización de la red, así como la producción e integración de fuentes—; 4) las redes de telecomunicaciones —incluidas la computación de borde y el Internet de las cosas—; 5) la agricultura; 6) aeroespacial, incluidos los datos de observación de la Tierra generados desde el espacio; 7) defensa; 8) previsiones medioambientales; 9) productos farmacéuticos y 10) atención sanitaria.
La base de la competitividad de la IA: la cadena de valor del intercambio de datos
Como toda tecnología digital, la IA no es un fin en sí misma, sino un motor de competitividad. Por lo tanto, conviene distinguir los casos de uso típicos de la IA industrial:
1 — Uso de servicios digitales basados en IA
En este caso, las empresas industriales simplemente «consumen» servicios digitales/inteligentes proporcionados por vendedores de software, etc., que utilizan IA, tanto predictiva como generativa. Se pueden encontrar ejemplos en diversos ámbitos, como los servicios de sensores mejorados por IA, los servicios de estimación de la hora de llegada en el ámbito de la logística, etc.
2 — Uso de la IA predictiva para los servicios digitales/inteligentes de la industria
Las empresas industriales utilizan sus propios datos y/o los de sus clientes para prestarles un servicio digital. Un ejemplo son los servicios de mantenimiento predictivo o de supervisión del estado de un producto que utilizan los datos creados durante el uso de un producto de la empresa industrial en cuestión. De este modo, las empresas privadas (clientes) comparten sus datos para beneficiarse de mejores servicios digitales. Si los datos de los clientes se utilizan para servicios digitales/inteligentes, se aplica la ley europea de datos, que regula los derechos del titular de los datos.
3 — Uso de IA generativa por parte de una empresa industrial
Las actividades de los procesos comerciales, como el abastecimiento, la contabilidad, el marketing, etc., pueden acelerarse y automatizarse mediante el uso de grandes modelos de lenguaje (LLM). Sin embargo, la mayoría de los LLM son propiedad de empresas de IA no europeas.
4 — Enriquecimiento de la IA generativa por parte de una empresa industrial
En este caso, las empresas industriales no se limitan a utilizar LLM, sino que despliegan tecnologías como RAG (Retrieval Augmented Generation) para «enriquecer» los LLM con datos privados.
Este enfoque aumenta el rendimiento del LLM.
Es necesario evaluar los datos compartidos, ya que, de lo contrario, una empresa privada no tendría ningún incentivo para alimentar el LLM con sus propios datos.
5 — Modelos básicos industriales compartidos/LLM
En este caso, varias empresas privadas comparten sus datos para formar y/o perfeccionar conjuntamente un modelo básico/LLM. No tenemos conocimiento de ningún caso productivo de este tipo en la práctica: los intermediarios que facilitan el intercambio de datos están sujetos a la ley europea de gobernanza de datos para evitar que se compartan datos en detrimento de los titulares de los derechos sobre los mismos.
Para reducir las dependencias y aumentar la competitividad, las empresas y los responsables políticos deben comprender la cadena de valor subyacente del intercambio de datos, que amplía la cadena de valor tradicional de los datos y la IA —que consiste en recopilar, crear, conservar, enriquecer, almacenar y distribuir datos y utilizarlos para formar modelos de IA— con el concepto de intercambio. En Europa, ningún actor posee por sí solo todos los recursos necesarios (infraestructura informática, datos, confianza, etc.) para operar la cadena de valor completa del intercambio de datos.
En el ecosistema extremadamente dinámico de la IA, es esencial identificar dónde deben ir las inversiones europeas.
¿Debe darse prioridad al desarrollo de modelos de fundación genéricos potentes o más bien al ajuste fino y la personalización de modelos abiertos? La cuestión es de extrema actualidad con la llegada del R1 de DeepSeek. La comunidad de IA sigue debatiendo para identificar los factores que han hecho de R1 un modelo superior: mejor calidad de los datos iniciales, proceso de «curación» más eficaz, uso del aprendizaje por refuerzo, «destilación» en modelos más pequeños…
En Europa, ningún actor posee por sí solo todos los recursos necesarios para operar la cadena de valor completa del intercambio de datos.
Boris Otto y Hubert Tardieu
Sea como fuere, Hugging Face ya ofrece Open-R1 3, una reproducción completa del R1 de DeepSeek para facilitar la reutilización del modelo base y el desarrollo de modelos especializados por industria sobre este modelo genérico.
En este contexto, los campeones europeos en IA como Mistral AI en Francia o Aleph Alpha en Alemania pueden plantearse concentrarse en el cuarto y quinto caso de uso descritos anteriormente para utilizar modelos de base abiertos y centrarse en el ajuste fino específico de cada industria que será el que más valor cree. Esta estrategia se ve favorecida por el hecho de que en Europa se pueden desarrollar con éxito modelos de tamaño medio, como demuestra el ejemplo de Teuken 7B 4.
Centrarse en lo posterior —el de mayor valor añadido de la cadena de valor— lleva a identificar similitudes con muchos ecosistemas de intercambio de datos que utilizan infraestructuras de proveedores de nube no europeos, pero garantizan la protección y la soberanía de los datos a través de arquitecturas reguladas y estándares industriales, como el protocolo de espacio de datos de IDSA 5 y la arquitectura de confianza de Gaia-X 6.
La infraestructura informática y el «tesoro de datos» que se menciona a menudo están repartidos entre muchas organizaciones diferentes, tanto privadas como públicas. Para facilitar los modelos de fundaciones compartidas, deben cumplirse los mismos requisitos que para la economía de datos de la Unión en general: confianza, soberanía, trazabilidad, economía de datos, etc. Estos requisitos han sido el centro de la actual estrategia europea en materia de datos y, por lo tanto, también deben cumplirse en la Unión Europea de Datos y en el Plan de Prioridades en materia de IA vertical.
Además, los espacios de datos más avanzados, como Catena en la industria automotriz, se enfrentan cada vez más al desafío de la interoperabilidad de los datos.
Los espacios de datos no exigen que todos los participantes en el espacio de datos adopten desde el principio un conjunto común de definiciones de datos; para no imponer tal ontología como condición previa 7, los espacios de datos han centrado primero su atención en la adopción de definiciones de datos comunes para cada uno de sus principales casos de uso; en una segunda fase, deben armonizar estas definiciones utilizando IA generativa y los LLM existentes enriquecidos con los catálogos de datos utilizados por cada socio del espacio de datos. De este modo, se dispondrá de conjuntos de datos utilizables por la industria para alimentar nuevas aplicaciones de IA con datos de calidad obtenidos con el consentimiento de sus propietarios.
La competitividad de la IA en Europa sólo puede aumentar si se aprovechan al máximo las inversiones en los espacios comunes europeos de datos y el marco regulador de la economía de los datos.
Situación actual del espacio común europeo de datos
En los últimos cuatro años, los Estados miembros de la Unión Europea y la Comisión Europea ya han comprometido una cantidad significativa de recursos para la creación de espacios de datos aprovechando el Fondo de Recuperación y Resiliencia (FRR) tras la pandemia de Covid-19. El cuadro que figura a continuación ofrece una visión general de la cartera de financiación a nivel europeo y de los Estados miembros.
Si bien la importancia del intercambio de datos ya se comprende bien en la mayoría de los países europeos, los gobiernos que financiaron los primeros espacios de datos —en Alemania desde 2019 y en Francia desde 2021— aún esperan un retorno de la inversión. Con la convergencia de los fundamentos tecnológicos de los espacios de datos, los esfuerzos conjuntos deben centrarse ahora en la adopción, la creación de valor y la captura de datos compartidos. Si la tecnología es la condición necesaria para el éxito, la economía es la condición suficiente.
Varios ejemplos recientes muestran que la comunidad necesita apoyo. Fundada en 2020, AgDataHub 8, por ejemplo, se cerró en noviembre de 2024 porque su modelo de negocio no era capaz de alcanzar el umbral de rentabilidad a pesar de los 85.000 agricultores conectados y el importante apoyo de los sindicatos agrícolas. Los principales casos de uso abordados por AgDataHub se centraban en la identidad de confianza de los agricultores para facilitar el intercambio de datos administrativos con las autoridades, así como en la trazabilidad de los alimentos y la genética animal, todos ellos casos de uso que siguen siendo muy estratégicos para la agricultura en Europa.
El Centro de Apoyo a los Espacios de Datos (DSSC) ofrece numerosas herramientas para apoyar a los espacios de datos en su camino hacia una adopción exitosa, como los «bloques de construcción comerciales y organizativos» y el «método de creación conjunta» 9. Además, un proyecto del Instituto Gaia-X sobre la economía del intercambio de datos ha definido cuatro niveles de madurez que es necesario superar antes de obtener los beneficios de un espacio de datos autónomo. El modelo propuesto 10 establece que un conjunto de casos de uso acordados es una condición previa para subir de nivel de madurez.
Tres ejemplos incluidos en los diez sectores estratégicos seleccionados por Mario Draghi en su informe pueden ilustrar el camino a seguir.
Aeroespacial
El sector aeroespacial se enfrenta a un doble desafío.
Por un lado, una demanda de aviones que representa una cartera de 8.000 aviones o 10 años de producción y, por otro, una importante reestructuración del modelo de producción prevista en los próximos 30 años para producir aviones con bajas emisiones de carbono. Por lo tanto, el principal caso de uso del importante proyecto aeroespacial europeo que se pondrá en marcha en 2025 será la cadena de suministro y la capacidad de los principales fabricantes de aeronaves y sus proveedores de piezas para compartir un espacio común de datos con el fin de optimizar y «desriesgar» el suministro de piezas.
Hace doce años se puso en marcha una primera iniciativa llamada BoostAerospace 11. Reúne a cuatro grandes fabricantes de Francia: Airbus, Safran, Dassault y Thalès, lo que les permite comprar conjuntamente la mayoría de sus piezas. Se necesitaron casi ocho años para que el sistema alcanzara su viabilidad económica. El nuevo espacio de datos ampliará el alcance funcional de BoostAeroSpace al diseño de productos compartidos y al cumplimiento de las normas de exportación.
Energía
El sector de la energía, por su parte, se beneficiará del intercambio de datos tanto para optimizar la distribución de la energía, como se ha empezado a hacer con los contadores inteligentes, como para la producción, y más concretamente para la producción de energía nuclear.
En Europa, sólo algunos Estados miembros están involucrados, y Francia está especialmente interesada en la construcción de al menos 6 nuevos reactores llamados EPR2. Al igual que en el caso de la industria aeroespacial, la cadena de suministro es el caso de uso crítico, con más de 1.500 empresas implicadas para alcanzar el objetivo principal de reducir el tiempo de construcción de un nuevo reactor a 70 meses (en China ya es de 60 meses).
La producción industrial
En el ámbito de la fabricación, Alemania ha puesto en marcha recientemente la iniciativa International Manufacturing-X (IM-X) con el fin de aumentar la competitividad, la resiliencia y la sostenibilidad de la industria manufacturera alemana, europea y mundial a través de ecosistemas de datos industriales.
Como proyecto insignia de Manufacturing-X, Factory-X 12 se centra en 11 casos de uso específicos que tienen como objetivo mejorar e integrar los aspectos horizontales y verticales de la cadena de suministro en las operaciones industriales. Estos casos de uso están diseñados para ampliar las soluciones existentes centradas en la cadena de suministro desarrolladas por Catena-X, con un énfasis en la integración vertical, que conecta directamente y optimiza las operaciones de la planta. El consorcio está dirigido por los dos principales campeones de la Industria 4.0: Siemens AG y SAP, que llevan años liderando la cadena de suministro y la automatización de las fábricas.
Como bien menciona el informe Draghi:
A lo largo del tiempo se han creado varias alianzas industriales de la Unión para tecnologías basadas en la nube y el intercambio de datos con diversas atribuciones (Andrómeda, Gaia-X, Catena-X).
Todos los nuevos espacios de datos utilizan los cimientos establecidos por Gaia-X e inaugurados por Catena, que está operativo desde octubre de 2023. Las iniciativas europeas en los ámbitos de la aeronáutica, la energía nuclear y la fabricación reutilizarán la arquitectura técnica distribuida y el marco de confianza para coordinar la cadena de suministro y el diseño de nuevos productos en los próximos tres a cinco años.
La recreación de una nueva industria europea de informática desmaterializada para competir con las grandes empresas ya no es la opción preferida. Como recuerda el informe de Mario Draghi 13, se ha encontrado un término medio:
Los distintos sectores de la aeronáutica, la energía y el automóvil han definido sus requisitos en términos de interoperabilidad y soberanía, que se han incorporado en etiquetas voluntarias de 1 a 3. Estas etiquetas son utilizadas por los actores de la aeronáutica, la energía y la automoción para comunicar sus requisitos a los proveedores de servicios en la nube que ofrecen sus servicios para implementar el intercambio de datos. Dado que es difícil para los usuarios verificar la conformidad de los servicios en la nube con las etiquetas, Gaia-X ha establecido cámaras de compensación (una o dos en cada país) que certifican la conformidad de los servicios en la nube con las etiquetas.
Tras definir su estrategia en materia de datos, la anterior Comisión Europea tuvo la sensatez de centrarse en el establecimiento de la nueva normativa, dejando en manos de asociaciones industriales como Gaia-X la responsabilidad de elaborar las mejores opciones en términos de arquitectura, normas y etiquetas.
Se han establecido dos reglamentos que abarcan múltiples aspectos, dos de los cuales son especialmente relevantes para contribuir a la creación de espacios de datos exitosos:
- La Ley de Gobernanza de Datos (DGA) ha identificado la función del «intermediario de datos» que proporciona servicios de intercambio de datos a los socios del espacio de datos; estos servicios se basan en servicios genéricos de nube que respetan la etiqueta requerida por los usuarios de los espacios de datos y se facturan a estos usuarios por suscripción o por transacción, de la misma manera que el software como servicio (SAAS) se ofrece desde hace años en la industria del software. La DGA recomienda (o impone 14) que ninguno de los participantes en el espacio de datos sea también el intermediario de datos, para evitar el sesgo observado en el mundo B-to-C, donde Amazon se beneficia de una ventaja indebida sobre los demás comerciantes al explotar la plataforma.
- La Ley de Datos (DA) establece una gran cantidad de disposiciones necesarias para el intercambio de datos y que se han incorporado a las etiquetas. Define un principio clave: los datos generados por un equipo pertenecen al propietario del equipo y no al vendedor del equipo. Este principio facilita el intercambio de datos: en cuanto el propietario del equipo está dispuesto a compartir los datos generados por el equipo durante su funcionamiento (después de tomar posesión del equipo), el intercambio bidireccional de datos entre el vendedor y el usuario del equipo es primordial y permite reducir los costes de explotación y mantenimiento.
La experiencia adquirida durante el lanzamiento de los primeros espacios de datos, ya sea con éxito o no, contribuye de manera valiosa a la identificación de los principios de la economía del intercambio de datos.
La infraestructura del espacio de datos (marcos de confianza, transacciones de intercambio de datos, etc.) debe establecerse para permitir aprovechar los beneficios comerciales del intercambio de datos y, de este modo, alcanzar el punto de equilibrio de las inversiones en infraestructura y estar preparados para compartir datos para el entrenamiento y perfeccionamiento de la IA generativa colectiva.
Si se considera la cartera de actividades actual, los nuevos espacios de datos importantes apuntan a este nivel de madurez y al umbral de rentabilidad para los principales casos de uso a finales de 2027, lo que permitirá la reutilización operativa de los datos industriales en 2028.
En otras palabras: no hay que esperar cosechar en primavera lo que se sembró en otoño.
Aprovechar las inversiones en el espacio de datos europeo para los sectores de IA vertical
El informe Draghi define objetivos y propuestas claras en materia de IA, algo que no podemos sino aprobar:
La Unión debe aspirar a ser líder en el desarrollo de la IA en sus sectores fuertes, recuperar y mantener el control de los datos y los servicios sensibles en la nube, y desarrollar una sólida base financiera y de talento para apoyar la innovación en informática e IA. Para lograrlo, la Unión debería esforzarse por ocupar una posición fuerte en los próximos cinco años en lo que respecta a la IA integrada en sectores industriales clave, como la fabricación avanzada y la robótica industrial, la química, las telecomunicaciones y la biotecnología, sobre la base de un conjunto de grandes modelos lingüísticos y modelos sectoriales verticales elaborados por la Unión. (…) Para alcanzar estos objetivos, la Unión debería adoptar una nueva ley sobre el desarrollo de la informática en la nube y la IA, con el fin de reforzar las capacidades e infraestructuras europeas de cálculo intensivo 15, IA y cuántica, armonizar los requisitos de arquitectura en la nube y los procesos de contratación pública, y coordinar las iniciativas prioritarias para aumentar la participación y la financiación del sector privado.
Creemos que el plazo propuesto de cinco años es adecuado y coherente con las metas y objetivos de la Década Digital: que el 75 % de las empresas de la Unión utilicen la nube, la IA o los macrodatos para 2030.
Sin embargo, la forma de gastar durante estos cinco años es esencial. Ahora bien, la lectura de algunos pasajes de la parte B del informe sobre el Plan de prioridades de la Unión en materia de IA vertical puede suscitar inquietudes:
«Este esfuerzo se alimentaría con datos proporcionados libremente por las empresas de la Unión y estaría respaldado por marcos de código abierto en industrias con un uso intensivo de datos, debidamente protegidos de la aplicación de las normas antimonopolio de la Unión, con el fin de fomentar la cooperación sistemática entre las principales empresas de la Unión para la IA generativa y los campeones industriales a escala de la Unión en sectores clave.»
Sin entrar a discutir la gobernanza propuesta para el desarrollo de los principales sectores de la IA vertical a través de una «incubadora de IA tipo CERN», no queremos apostar el futuro de Europa en materia de IA en la quimérica hipótesis de que las empresas europeas —profundamente implicadas en el mercado mundial— estén dispuestas a proporcionar sus datos de forma gratuita.
Por ejemplo, la razón por la que la industria aeronáutica está dispuesta a compartir sus datos no es altruista: se trata principalmente de aumentar su volumen de entregas por encima de las 800 aeronaves al año para diseñar conjuntamente, con el resto del ecosistema aeronáutico, el avión de bajas emisiones de carbono. Del mismo modo, la razón por la que la industria nuclear ha decidido crear un espacio de datos es para hacer frente al reto de entregar una central nuclear cada 70 meses con el fin de proporcionar suficiente energía limpia para apoyar el desarrollo de Europa.
No queremos apostar el futuro de Europa en materia de IA sobre la hipótesis quimérica de que las empresas europeas estén dispuestas a proporcionar sus datos de forma gratuita.
Boris Otto y Hubert Tardieu
Las empresas no proporcionarán sus datos de forma gratuita a modelos compartidos, sino que exigirán, con razón, confianza, transparencia, claridad sobre la propiedad de los modelos y una serie de criterios adicionales. Los espacios de datos deben ser precisamente la herramienta disponible para responder a estos requisitos fundamentales.
En 2025, el intercambio de datos es entendido por varias industrias, en particular las mencionadas en el informe Draghi, como la única forma de hacer frente a los desafíos existenciales a los que se enfrentan debido al calentamiento global; en varios de los nuevos espacios de datos que acaban de lanzarse, alcanzar el umbral de rentabilidad para los casos de uso más críticos (cadena de suministro, diseño de vehículos con bajas emisiones de carbono, cumplimiento de la normativa medioambiental) llevará tres años, lo cual es una condición previa para un proceso sostenible de recopilación de datos industriales para la IA a escala de toda la industria; como se menciona al final de la sección 2, la interoperabilidad de los datos en toda la industria deberá haberse resuelto mientras tanto para que los datos industriales puedan utilizarse en toda la industria más allá del ámbito de los casos de uso para los que se han recopilado los datos.
Por lo tanto, recomendamos que, después de 4 años de financiación por parte de Europa y los Estados miembros, se lleve a cabo una revisión en profundidad de los espacios de datos que estén llegando al final de su financiación.
El Instituto Gaia-X y la Universidad Paris Dauphine han propuesto un modelo de madurez para evaluar la viabilidad económica de los espacios de datos existentes 16, siguiendo la definición propuesta por el Centro de Apoyo al Espacio de Datos de la Unión 17. Es importante anticiparse a los espacios de datos existentes que corren el riesgo de colapsar cuando se interrumpa la financiación.
Europa ha sido pionera en su estrategia de datos y, sin duda, se han cometido errores en el pasado, pero la próxima generación de espacios de datos, que se lanzará en 2025, deberá ser rentable en los próximos 3 o 4 años para cada uno de los casos de uso propuestos; deberá identificarse un camino hacia la interoperabilidad de los datos utilizando IA generativa, mientras tanto, para garantizar la reutilización de los datos sectoriales de la industria para la IA.
El informe Draghi, en la sección sobre la nube, propone otra recomendación que apoyamos:
Apoyar a los corredores de datos (ex Data Governance Act) como intermediarios de datos «preaprobados», certificando la conformidad ex ante con el acervo de la Unión y garantizando la autorización reglamentaria a través del mecanismo del «mediador de la Unión». Esto contribuiría a fomentar las soluciones específicas de la industria promovidas por las empresas de la Unión.
Más allá de los aspectos reglamentarios para los intermediarios de datos, hemos visto recientemente que los intermediarios de datos, que también llamamos «orquestadores», concentran la mayoría de los riesgos económicos que los miembros regulares no están dispuestos a asumir y que a veces se ocultan con las cuotas de los miembros, lo que permite que el espacio de datos sobreviva mientras encuentre nuevos miembros, creando de facto una pirámide de Ponzi. Los intermediarios de datos seguirán desempeñando un papel clave en el éxito de la adopción del espacio de datos y la inteligencia artificial, ya que satisfacen las necesidades de interoperabilidad, funcionan como una entidad de confianza y coordinan el despliegue de los fondos invertidos, la mayoría de las veces en el marco de asociaciones público-privadas.
Por último, el informe Draghi aborda el importante punto de los «entornos de pruebas de IA», que son regímenes normativos que dejan espacio para la experimentación:
Armonizar los regímenes nacionales de «sandbox» para la IA en todos los Estados miembros con el fin de permitir la experimentación y el desarrollo de aplicaciones innovadoras de la IA en los sectores industriales seleccionados y garantizar una aplicación armonizada y simplificada del RGPD.
Creemos que esta recomendación es esencial en ámbitos como la salud, la conducción autónoma, pero también en todo el campo de los agentes autónomos, que puede experimentar un fuerte desarrollo en un futuro próximo.
Conclusión
El informe Draghi tiene razón al pedir una mayor competitividad económica en una época en la que cada vez son más las demandas de autonomía estratégica y soberanía tecnológica.
La IA es la tecnología que ofrece hoy la fuente más poderosa de ventajas competitivas. Por eso Europa debe estimular la innovación en el campo de la IA y reducir las dependencias económicas.
El éxito de la IA depende de la disponibilidad de recursos clave como la capacidad de cálculo, los grandes modelos de lenguaje/fundación y los datos. A diferencia de otros ámbitos económicos, estos recursos no están en manos de unos pocos actores del mercado ni bajo el control del Estado, sino que están repartidos entre diversas partes interesadas.
Por eso, Europa debe encontrar su propio camino para alcanzar el objetivo urgente de competitividad establecido por el informe Draghi. El camino europeo debe caracterizarse por ecosistemas de intercambio que consistan en un panorama distribuido de capacidad de cálculo, modelos básicos y datos para entrenar y perfeccionar estos modelos. Este camino sólo será coronado por el éxito cuando se ponga en marcha un plan de acción que tenga en cuenta los aspectos técnicos, pero sobre todo los aspectos relacionados con la gobernanza y los negocios. La primera fase de la estrategia europea en materia de datos ha establecido los marcos necesarios para avanzar hacia una verdadera Unión Europea de los Datos.
Notas al pie
- El anuncio por parte de DeepSeek de R1 a finales de enero de 2025 ofrece una nueva oportunidad para la IA generativa abierta, ya que su diseñador ha anunciado que el coste de entrenamiento de su modelo es 20 veces inferior al de GPT4. Aunque esto es alentador, también acentuará los retos de soberanía en cuanto al uso potencial de los datos por parte de las autoridades chinas.
- Cf. Conroy, G., & Mallapaty, S., « How China created AI model DeepSeek and shocked the world », Nature, 2025.
- Elie Bakouch, Leandro von Werra, Lewis Tunstall, « Open-R1 : a fully open reproduction of DeepSeek-R1 », Hugging Face, 28 de enero de 2025.
- « Teuken-7B : Multilingual open-source large language model released », 2 de diciembre de 2024.
- « The Dataspace Protocol », Declaración de IDSA, julio de 2024.
- « Deliverables & Gaia-X Standard – Gaia-X : A Federated Secure Data Infrastructure »
- En este contexto, una ontología es un conjunto de conceptos y categorías de un tema o dominio que muestra sus propiedades y la relación entre ellos.
- AgDataHub.
- Véase Knowledge-base : Data Spaces Support Centre para más detalles.
- Eric Brousseau, Lucas Eustache, Joëlle Toledano, « Position Paper : Economics of Data Sharing », Gaia-X, 2024.
- Véase su página web oficial.
- Factory-X.
- «Dado el dominio de los proveedores estadounidenses, la Unión necesita encontrar el equilibrio adecuado entre promover su industria nacional de la nube y garantizar el acceso a las tecnologías que necesita.»
- La DGA exige que los proveedores de servicios de intermediación de datos estén registrados y puedan solicitar la marca de confianza de la UE para demostrar que cumplen todos los requisitos legales.
- HPC (High Performance Computing) se refiere a una nueva generación de superordenadores en el rango de los exaflops. EuroHPC es una iniciativa conjunta de la UE, los países europeos y socios privados para desarrollar un ecosistema de superordenadores de categoría mundial en Europa.
- Eric Brousseau, Lucas Eustache, Joëlle Toledano, « Position Paper : Economics of Data Sharing », Gaia-X, 2024.
- Modelo de madurez del espacio de datos: un conjunto de indicadores y una herramienta de autoevaluación que permite a las iniciativas del espacio de datos conocer su madurez en el ciclo de desarrollo, sus indicadores de rendimiento y sus capacidades técnicas, funcionales, operativas, comerciales y jurídicas en términos absolutos y en relación con sus homólogas.