La IA revela la forma de las proteínas en 3D y abre la puerta a nuevos fármacos
El programa AlphaFold2 descubre cómo adquieren su estructura estos elementos
Un programa de inteligencia artificial, AlphaFold2, de la compañía DeepMind, ha logrado predecir la forma de las proteínas en tres dimensiones, lo que resulta clave para comprender qué funciones ejercen y el papel de las mutaciones en las enfermedades. También abre la puerta a diseñar nuevos fármacos y vacunas.
En opinión de Alfonso Valencia, investigador Icrea y director del departamento de Ciencias de la Vida del Barcelona Supercomputing Center (BSC-CNS), “sería esperable que les dieran el Nobel de química”. “Han resuelto el problema de la estructura de las proteínas y han publicado sus métodos y predicción en abierto, para toda la comunidad”, añade
Las proteínas son la mano de obra de las células. Se encargan de ejecutar las instrucciones contenidas en el ADN y participan en todos los procesos biológicos del organismo. Esenciales para la vida, están formadas por aminoácidos, sus componentes básicos. Para que la proteína desempeñe su función, debe plegarse formando una estructura en 3D.
Desde hace 50 años, los investigadores trataban de descifrar qué estructura adopta una proteína en base a la secuencia de sus aminoácidos, un proceso experimental, muy laborioso, que, a menudo, les llevaba años resolver.
El equipo de DeepMind ha resuelto este puzle usando una red neuronal, un tipo de inteligencia artificial que han entrenado a partir de una base de datos que contiene unas 170.000 secuencias de proteínas y sus estructuras.
Ya en la primavera del 2020 presentaron su modelo en un certamen internacional de predicción de proteínas, CASP14, y demostraron que AlphaFold2 tenía un nivel de eficacia similar al de los métodos experimentales y superior a la de otros métodos computacionales usados. Además, era capaz de solventar la estructura de estos compuestos orgánicos en minutos. Ahora DeepMind publica en Nature la metodología de su sistema y comparte en abierto el código de su algoritmo, aunque lo han patentando. “Un par de años atrás parecía imposible pensar que podríamos entrenar un modelo capaz de predecir a un nivel muy alto de precisión, y a gran escala, la estructura de proteínas a partir de su secuencia de aminoácidos”, explica en una entrevista a La Vanguardia Oriol Vinyals, investigador de DeepMind y coautor del trabajo. “Considerando que los ejemplos con los que entrenar a AlphaFold2 son escasos, esta hazaña es aún más sorprendente en el mundo del aprendizaje automático”, añade.
En el estudio, el equipo de DeepMind, una empresa que Google compró en 2014, “detallan en profundidad lo que presentaron en CASP14. Esto nos permite al resto que trabajamos en este campo comprender mejor cómo lo han hecho”, valora Valencia.
La red neuronal usada por DeepMind es del tipo red de atención y consiste en una técnica de aprendizaje profundo que permite a la inteligencia artificial entrenarse centrándose en partes concretas de un problema mayor.
“Procede del ámbito del procesamiento del lenguaje natural, cuando el algoritmo analiza textos y las redes neuronales se fijan en conexiones y palabras concretas”, explica Valencia, que destaca que “lo brillante” de AlphaFold2 es que supone un “cambio de paradigma revolucionario”. Esta inteligencia artificial ha sido entrenada con 170.000 secuencias de proteínas y sus estructuras. Cristina Sáez