Las proteínas desempeñan funciones esenciales en el organismo: transportan nutrientes por el cuerpo, intervienen en el sistema inmunitario, en la circulación sanguínea, en la contracción muscular… Conocer su estructura permite comprender mejor el funcionamiento de las enfermedades y contribuye así al desarrollo de medicamentos.

Hace unos años, sólo conocíamos unas pocas decenas de miles de estructuras de los 2.000 millones que se calcula que existen. Una nueva herramienta de IA acaba de cartografiar más de mil millones 1.

  • Antes de la inteligencia artificial, la predicción de la estructura de las proteínas se basaba principalmente en la cristalografía de rayos X, un método laborioso y costoso desarrollado a principios del siglo XX.
  • El lanzamiento en 2018 de AlphaFold, un programa de inteligencia artificial desarrollado por Google DeepMind, revolucionó el campo al permitir, en 2020, predecir la estructura de los 200 millones de proteínas identificadas por los investigadores.
  • Los métodos anteriores habían permitido identificar unas 170.000 proteínas en 60 años 2.

El miércoles 27 de mayo, investigadores de la Chan Zuckerberg Initiative, un instituto biomédico creado por Mark Zuckerberg y Priscilla Chan, presentaron una nueva base de datos, ESM Atlas, que contiene más de mil millones de estructuras proteicas y varios miles de millones de secuencias proteicas adicionales. De este modo, supera a la base de datos de AlphaFold, que cuenta con unos 800 millones de estructuras, y a una versión anterior de ESM Atlas, que tenía unos 300 millones.

  • Los investigadores responsables de la base de datos afirman que el atlas «tiene como objetivo mostrar la biología de las proteínas en su totalidad, y en particular sus aspectos menos conocidos».
  • Afirman haber utilizado el modelo de IA ESMFold2 para diseñar nuevos anticuerpos y proteínas capaces de unirse a otras proteínas implicadas en cánceres y trastornos inmunológicos 3.
  • Al parecer, gran parte de los modelos probados en el laboratorio habrían funcionado 4.

El uso de la inteligencia artificial por parte de los investigadores podría acelerar considerablemente la comercialización de nuevos medicamentos, reducir los costes y mejorar las probabilidades de éxito clínico.

Notas al pie
  1. ESM Atlas, Biohub.
  2. Robert F. Service, «“The game has changed.” AI triumphs at solving protein structures», Science, 30 de noviembre de 2020.
  3. Ewen Callaway y Miryam Naddaf, «Move over, AlphaFold: open-source model predicts shape of 1 billion proteins», Nature, 27 de mayo de 2026.
  4. Salvatore Candido et al., «Language Modeling Materializes a World Model of Protein Biology», 27 de mayo de 2026.