{"id":95863,"date":"2026-04-10T13:00:00","date_gmt":"2026-04-10T11:00:00","guid":{"rendered":"https:\/\/legrandcontinent.eu\/es\/?p=95863"},"modified":"2026-04-10T10:15:04","modified_gmt":"2026-04-10T08:15:04","slug":"superar-los-llm-por-una-ia-improbable","status":"publish","type":"post","link":"https:\/\/legrandcontinent.eu\/es\/2026\/04\/10\/superar-los-llm-por-una-ia-improbable\/","title":{"rendered":"Superar los LLM: por una IA improbable"},"content":{"rendered":"\n
La tecnolog\u00eda de la IA no es socialmente neutra; la imprenta, la radio o internet tampoco lo eran. Cada una de estas tecnolog\u00edas ha facilitado y hecho m\u00e1s accesible el intercambio de informaci\u00f3n. Cada una de ellas redistribuy\u00f3 al mismo tiempo el poder de transmitir mensajes y de ser escuchados. Cada una de ellas sufri\u00f3 finalmente la concentraci\u00f3n propia de las industrias de red: costos fijos que crean barreras de entrada, rendimientos crecientes que benefician a los actores ya establecidos, efectos de red que convierten el tama\u00f1o en una ventaja acumulativa.<\/p>\n\n\n\n
Al igual que sus predecesores, los grandes modelos de lenguaje (LLM) son tecnolog\u00edas culturales: sistemas que absorben, reorganizan y regeneran la expresi\u00f3n humana a escala planetaria. <\/span>1<\/sup><\/a><\/span><\/span><\/p>\n\n\n\n Todos estos sistemas realizan impl\u00edcitamente elecciones de valores sobre lo que se hace probable, lo que se margina, lo que desaparece en un silencio estad\u00edstico. Lo que distingue a los LLM de sus predecesores es que estas elecciones est\u00e1n inscritas en la arquitectura incluso antes de cualquier deliberaci\u00f3n humana.<\/p>\n\n\n\n Los LLM son, ante todo, sistemas entrenados para completar textos: <\/span>2<\/sup><\/a><\/span><\/span> expuestos a cantidades masivas de escritos humanos, aprenden qu\u00e9 palabras, qu\u00e9 formulaciones, qu\u00e9 asociaciones de ideas siguen con mayor probabilidad a tal o cual secuencia. Este aprendizaje es refinado por evaluadores humanos y procesos automatizados, pero este refinamiento opera sobre una base ya constituida.<\/p>\n\n\n\n Es aqu\u00ed donde se elige deliberadamente el silencio estad\u00edstico. Alimentados por textos de internet que sobrerrepresentan el ingl\u00e9s y las fuentes institucionales, los LLM reproducen estructuralmente estas sobrerrepresentaciones en cada una de sus respuestas.<\/p>\n\n\n\n No por malicia, sino por su propia naturaleza.<\/p>\n\n\n\n Una tecnolog\u00eda que elimina sistem\u00e1ticamente lo improbable empobrece el reservorio del que podr\u00eda surgir el futuro.<\/p>Marina Niforos, Milena Harito y Mira Mezini<\/cite><\/blockquote><\/figure>\n\n\n\n Esta visi\u00f3n selectiva ha recibido desde entonces un nombre: la mirada de Silicon<\/em>.<\/p>\n\n\n\n Los LLM se entrenan con textos f\u00e1ciles de recopilar a gran escala, es decir, el contenido que producen las poblaciones conectadas. Lo que es raro, oral, regional o anal\u00f3gico est\u00e1 estructuralmente ausente incluso antes de que el modelo comience a aprender.<\/p>\n\n\n\n Este primer desequilibrio se ve luego amplificado: las asociaciones frecuentes en los datos de entrenamiento se refuerzan como valores por defecto, de modo que conceptos como \u00abdemocracia\u00bb o \u00abjusticia\u00bb vienen precargados con los supuestos culturales de los textos que m\u00e1s los utilizan.<\/p>\n\n\n\n Esta distorsi\u00f3n est\u00e1 documentada emp\u00edricamente. Una investigaci\u00f3n publicada en PNAS Nexus<\/em> ha cartografiado los valores culturales de cinco grandes modelos GPT en relaci\u00f3n con datos de encuestas representativos de 107 pa\u00edses: cada modelo se situaba cerca de los valores de los pa\u00edses angl\u00f3fonos, independientemente del idioma en el que se le preguntara. <\/span>3<\/sup><\/a><\/span><\/span><\/p>\n\n\n\n No se trata de un sesgo ling\u00fc\u00edstico superficial. A trav\u00e9s de este mecanismo, una parte de los valores morales de la humanidad se define como punto de partida universal.<\/p>\n\n\n\n En otras palabras, el algoritmo ya no necesita \u00fanicamente nuestros \u00abme gusta\u00bb para aprender. Los valores que antes eran identificables \u2014descifrables en una producci\u00f3n cinematogr\u00e1fica, reconocibles en una l\u00ednea editorial\u2014 se vuelven insidiosamente predominantes, si no \u00fanicos.<\/p>\n\n\n\n Lo que est\u00e1 en juego va m\u00e1s all\u00e1 de la representaci\u00f3n equitativa de diferentes puntos de vista.<\/p>\n\n\n\n Las ideas m\u00e1s grandes siempre han surgido en los m\u00e1rgenes. El progreso de los derechos humanos o de los derechos de las mujeres es fruto de una larga lucha. Una tecnolog\u00eda que suprime sistem\u00e1ticamente lo improbable empobrece, por tanto, el reservorio del que podr\u00eda surgir el futuro: se reserva la decisi\u00f3n de lo que es probable.<\/p>\n\n\n\n Como escriben Francisco W. Kerche, Matthew Zook y Mark Graham en un art\u00edculo reciente: \u00abLa centralidad estad\u00edstica no es neutralidad. Es la aplicaci\u00f3n silenciosa de lo probable frente a lo posible\u00bb. <\/span>4<\/sup><\/a><\/span><\/span><\/p>\n\n\n\n Hoy en d\u00eda, un pu\u00f1ado de empresas concentra la casi totalidad de la capacidad de entrenamiento de los modelos de vanguardia. La infraestructura necesaria \u2014c\u00e1lculo, datos, talento\u2014 crea barreras de entrada considerables.<\/p>\n\n\n\n Es cierto que estas empresas han logrado avances cient\u00edficos reales y han abierto nuevas posibilidades a cientos de millones de usuarios. Sin embargo, plantean una cuesti\u00f3n concreta a los actores europeos: \u00bfhasta qu\u00e9 punto pueden tomar decisiones reales sobre la infraestructura que utilizan, los valores que esta incorpora y los datos que moviliza?<\/p>\n\n\n\n La l\u00f3gica comercial del desarrollo de la IA no es hostil a la diversidad cultural: le es indiferente de manera estructural.<\/p>\n\n\n\n Los datos de entrenamiento no hacen m\u00e1s que reflejar lo que abunda en l\u00ednea. Los criterios de alineaci\u00f3n, por su parte, se producen en ingl\u00e9s, en instituciones estadounidenses, seg\u00fan marcos normativos que no son culturalmente neutros.<\/p>\n\n\n\n La orientaci\u00f3n similar de las mayores empresas de IA no es fruto de una conspiraci\u00f3n entre ellas: basta con que el camino de menor resistencia conduzca, sistem\u00e1ticamente, en la misma direcci\u00f3n. El resultado es lo que el Instituto Ada Lovelace denomina una monocultura algor\u00edtmica<\/em>. <\/span>5<\/sup><\/a><\/span><\/span><\/p>\n\n\n\n El algoritmo ya no necesita solo nuestros \u00abme gusta\u00bb para aprender.<\/p>Marina Niforos, Milena Harito y Mira Mezini<\/cite><\/blockquote><\/figure>\n\n\n\n Europa se enfrenta a un dilema: ante plataformas transnacionales con sesgos arquitect\u00f3nicos, no solo necesita un marco normativo \u2014ya lo tiene\u2014, sino tambi\u00e9n capacidad productiva: datos, modelos y normas de alineaci\u00f3n que reflejen sus propias referencias culturales.<\/p>\n\n\n\n Hay otros caminos posibles, y ya existen.<\/p>\n\n\n\n En Espa\u00f1a, el proyecto ALIA ha producido modelos abiertos en catal\u00e1n, euskera y gallego, financiados con fondos p\u00fablicos. Estos demuestran que el rendimiento t\u00e9cnico y los derechos ling\u00fc\u00edsticos son compatibles.<\/p>\n\n\n\n En Quebec, la ley n.\u00ba 109, aprobada en diciembre de 2025, afirma que la diversidad cultural digital es un requisito normativo, no una aspiraci\u00f3n. La creaci\u00f3n de Mila, el Instituto Quebequense de Inteligencia Artificial, demuestra que una instituci\u00f3n p\u00fablica basada en la ciencia abierta puede apoyar una investigaci\u00f3n de primer orden sin ceder a la l\u00f3gica de las plataformas comerciales.<\/p>\n\n\n\n Estas son pruebas de que otras opciones siguen siendo posibles.<\/p>\n\n\n\n En un entorno informativo fragmentado, donde la ciencia y los datos de referencia son cuestionados, la fiabilidad de los sistemas que producen y organizan la informaci\u00f3n es una cuesti\u00f3n de bien p\u00fablico y no de mera eficiencia industrial. En la era de los modelos generativos, se tratar\u00eda de construir para su entrenamiento no una enciclopedia como Wikipedia, sino una infraestructura de datos y normas arraigada en las comunidades que la utilizan.<\/p>\n\n\n\n Europa cuenta, en este sentido, con ventajas reales. La European Language Grid, con sus miles de recursos multiling\u00fces; el proyecto HPLT, con siete petabytes de datos en 80 idiomas; o incluso modelos como Poro son tantas iniciativas que demuestran que una infraestructura p\u00fablica puede producir resultados de primer orden: proporciona un marco normativo que ya exige la representatividad cultural de los datos de entrenamiento. <\/span>6<\/sup><\/a><\/span><\/span><\/p>\n\n\n\n Hay otra cosa de la que carece Europa: la voluntad de tratar la cultura como lo que siempre ha sido, no un mercado de nicho o un activo estrat\u00e9gico, sino el sustrato de nuestra identidad, de nuestro v\u00ednculo social, un patrimonio que pertenece a quienes lo mantienen vivo y que se empobrece cuando dejamos de transmitirlo.<\/p>\n\n\n\n Aspirados, homogeneizados, restituidos en una forma empobrecida, los datos culturales pierden progresivamente lo que constitu\u00eda su valor: la singularidad, la variaci\u00f3n, lo improbable.<\/p>Marina Niforos, Milena Harito y Mira Mezini<\/cite><\/blockquote><\/figure>\n\n\n\n Las propuestas que siguen se organizan en torno a tres ejes complementarios \u2014datos, infraestructuras y modelos\u2014, que corresponden a los tres puntos de entrada en los que una intervenci\u00f3n p\u00fablica puede corregir lo que el mercado no har\u00e1 por s\u00ed mismo.<\/p>\n\n\n\n En Europa, se podr\u00edan considerar los datos de entrenamiento de alta calidad y culturalmente representativos como un bien com\u00fan. Las comunidades que los originan los gestionar\u00edan disponiendo de derechos colectivos sobre su uso: el derecho a establecer normas, a exigir transparencia y a evaluar los resultados.<\/p>\n\n\n\n Una vez constituidos estos datos, el ajuste de modelos europeos y abiertos podr\u00eda realizarse sobre corpus culturales de alta calidad, constituidos pacientemente y anotados por las comunidades implicadas. Se basar\u00eda en la Alliance for Language Technologies del consorcio europeo para la infraestructura digital, el proyecto High Performance Language Technologies o la European Language Grid.<\/p>\n\n\n\n Gracias a esta infraestructura que conecta datos y modelos, la alineaci\u00f3n determinante no ser\u00eda una norma jur\u00eddica externa, sino una l\u00f3gica cultural codificada en los propios datos, muy diferente de las \u00abconstituciones\u00bb propietarias redactadas en Silicon Valley.<\/p>\n\n\n\n Esas ser\u00edan las herramientas de nuestra independencia: para salir del aplanamiento cultural y mantener nuestro potencial de desarrollo basado en lo espec\u00edfico, lo \u00fanico, lo improbable.<\/p>\n\n\n\n Actores del sector privado como Mistral AI y Silo AI ya han demostrado que los equipos europeos son capaces de desarrollar y desplegar modelos de vanguardia a gran escala que son competitivos.<\/p>\n\n\n\n Pero Europa tambi\u00e9n deber\u00eda invertir en la pr\u00f3xima generaci\u00f3n de modelos fundamentales que vayan m\u00e1s all\u00e1 del paradigma dominante actual, por ejemplo, la iniciativa p\u00fablica NextFrontierAI, cuyo objetivo es construir arquitecturas m\u00e1s innovadoras, m\u00e1s eficientes en t\u00e9rminos de muestreo y estructuralmente m\u00e1s abiertas a la diversidad cultural.<\/p>\n\n\n\n La l\u00f3gica comercial del desarrollo de la IA no es hostil a la diversidad cultural: le es indiferente de manera estructural.<\/p>Marina Niforos, Milena Harito y Mira Mezini<\/cite><\/blockquote><\/figure>\n\n\n\n El lenguaje no es una simple herramienta de comunicaci\u00f3n.<\/p>\n\n\n\n Es el medio a trav\u00e9s del cual una sociedad delibera, legisla, educa y se gobierna a s\u00ed misma. Recurso com\u00fan, producto de generaciones, esta lengua pertenece a todos: no puede reducirse a la propiedad de un solo actor.<\/p>\n\n\n\nLa mirada de Silicon: lo probable como p\u00e9rdida<\/strong><\/h2>\n\n\n\n
Las falsas promesas del mercado<\/strong><\/h2>\n\n\n\n
Por una bifurcaci\u00f3n europea<\/strong><\/h2>\n\n\n\n
Una IA improbable: tres propuestas<\/strong><\/h2>\n\n\n\n
La condici\u00f3n cultural de una IA del futuro<\/strong><\/h2>\n\n\n\n