La inteligencia artificial predice la forma de casi todas las proteínas conocidas por la ciencia

El algoritmo AlphFold ha determinado las estructuras probables de casi todas las proteínas conocidas por la ciencia. Esto incluye aproximadamente 200 millones de proteínas de casi todos los organismos conocidos en la Tierra cuyo genoma ha sido secuenciado. Este avance podría permitir un desarrollo de fármacos más rápido, ayudar a combatir la malaria, la resistencia a los antibióticos y los desechos plásticos.

El sistema AlphFold AI decodifica la estructura de casi todas las proteínas conocidas por la ciencia, allanando el camino para el desarrollo de nuevos medicamentos o tecnologías que pueden ayudar a abordar desafíos globales como el hambre y la contaminación ambiental. De ahora en adelante, determinar la forma tridimensional de una proteína en particular será tan simple como escribir las palabras correctas en un motor de búsqueda de Google.

AlphaFold es una inteligencia artificial desarrollada por el equipo de DeepMind. Es una empresa relacionada con Google y tiene una sólida trayectoria en la creación de algoritmos avanzados. Hace unos años, su programa AlphaGo venció al maestro Go varias veces (más sobre eso en el texto: la inteligencia artificial nuevamente venció al maestro Go y se retiró). Otra IA de ellos, conocida como AlphaStar, demostró ser mejor que el 99,8 por ciento. jugadores en el juego de estrategia en tiempo real StarCraft II (más sobre esto en el texto: AlphaStar AI venció al 99.8% de los jugadores en StarCraft 2). Sin embargo, el logro de AlphaFold supera el buen rendimiento de los juegos.

AlphaFold proporciona la estructura de 200 millones de proteínas

Las proteínas son los componentes básicos de la vida. Están construidos a partir de cadenas de aminoácidos y plegados en formas complejas, y su estructura tridimensional determina en gran medida su función. Son responsables de la mayor parte de lo que sucede dentro de las células. El cuerpo humano utiliza decenas de miles de proteínas diferentes, cada una de las cuales consta de decenas o incluso cientos de aminoácidos. El orden en que se organizan estos aminoácidos determina cómo funcionan. La mayoría de los medicamentos se diseñan utilizando información estructural, y los mapas precisos suelen ser el primer paso para descubrir cómo funcionan las proteínas.

Durante varias décadas, los científicos han intentado predecir cómo las proteínas logran su estructura tridimensional. Suena trivial, pero el problema no es fácil de resolver. El número astronómico de configuraciones potenciales es tan asombrosamente grande que los científicos que se ocupan del problema han indicado que se necesitaría más tiempo que la edad del universo para explorar todas las configuraciones posibles.

Comprender la estructura tridimensional de una proteína le permite comprender cómo funciona y cómo cambiar su comportamiento. Aunque el ADN proporciona las instrucciones para crear una cadena de aminoácidos, predecir cómo interactúan para formar una forma tridimensional ha sido muy difícil hasta hace poco. Por esta razón, los científicos han descifrado solo una fracción de los aproximadamente 200 millones de proteínas conocidas por la ciencia.

A fines de 2020, AlphaFold dio un gran paso para resolver uno de los mayores desafíos de la biología: determinar la forma tridimensional de una proteína a partir de su secuencia de aminoácidos. Desde entonces, los algoritmos han analizado los códigos genéticos de todos los organismos cuyo genoma ha sido secuenciado y han predicho las estructuras de cientos de millones de proteínas.

Unos meses después de que se anunciaran los resultados de AlphaFold, el equipo de DeepMind publicó estructuras de proteínas para 20 especies, incluidas casi todas las 20 000 especies, en una base de datos abierta. proteínas humanas. La IA ya está lista y ha publicado un catálogo de estructuras predichas para más de 200 millones de proteínas, ¡que cubre casi todas las proteínas conocidas del planeta!

Los datos desarrollados por los algoritmos se pondrán a disposición del público. La base de datos funciona de manera similar al motor de búsqueda de Google. Genera predicciones de formas de proteínas en 3D de alta precisión. También proporciona información sobre la precisión de sus predicciones, para que los científicos sepan con qué pueden contar.

“Todo el Universo de las Proteínas”

– Básicamente, puede pensar que este catálogo cubre todo el universo de las proteínas. Incluye estructuras diseñadas para plantas, bacterias, animales y muchos otros organismos, lo que abre enormes posibilidades nuevas para que AlphaFold impacte en temas importantes como la sostenibilidad, la seguridad alimentaria y diversas enfermedades, dijo Demis Hassabis, fundador y director ejecutivo de DeepMind. “Estamos al comienzo de una nueva era de biología digital”, agregó.

Los científicos ya están utilizando algunas de las predicciones anteriores para ayudar a desarrollar nuevos medicamentos. En mayo, investigadores dirigidos por el profesor Matthew Higgins de la Universidad de Oxford anunciaron que habían utilizado modelos AlphaFold para ayudar a determinar la estructura de una proteína clave en el parásito de la malaria y determinar dónde era probable que se unieran los anticuerpos que podrían bloquear la transmisión de la enfermedad. parásito.

“Solíamos usar una técnica llamada cristalografía de rayos X para averiguar cómo se veía la molécula, pero debido a que es bastante dinámica y en movimiento, simplemente no podíamos manejarla”, dijo Higgins. “Cuando tomamos los modelos AlphaFold y los combinamos con nuestra evidencia experimental, de repente todo tuvo sentido. Esta estructura ahora se usará para diseñar vacunas mejoradas que induzcan los anticuerpos más fuertes que bloquean la transmisión, agregó.

Los modelos AlphaFold también están siendo utilizados por científicos del Centro de Innovación de Enzimas de la Universidad de Portsmouth para identificar enzimas del mundo natural que se pueden adaptar para el reciclaje de plásticos. “Nos tomó mucho tiempo filtrar esta enorme base de datos de estructuras, pero hemos abierto toda una gama de nuevas formas tridimensionales que nunca antes habíamos visto que realmente podrían descomponer el plástico”, dijo el profesor John McGeehan. .

Métodos existentes

Durante décadas, los científicos han descifrado las estructuras tridimensionales de las proteínas utilizando técnicas experimentales como la cristalografía de rayos X o la microscopía crioelectrónica. Pero tales métodos duran meses, incluso años, y no siempre funcionan. Gracias a ellos, se desarrollaron estructuras y funciones, entendidas solo por unas 170.000 personas. con más de 200 millones de proteínas que se encuentran en diversas formas de vida.

Las primeras estructuras proteicas completas se determinaron en la década de 1950 mediante cristalografía de rayos X. Gracias a esta técnica, se ha determinado la mayor parte de las estructuras proteicas. Sin embargo, durante la última década, la microscopía crioelectrónica se ha convertido en la herramienta favorita de muchos laboratorios de biología estructural.

En la década de 1960, los científicos se dieron cuenta de que si podían enumerar todas las interacciones individuales en la secuencia de una proteína, podían predecir su forma tridimensional. Con cientos de aminoácidos en una proteína y las muchas formas en que interactúa cada par de aminoácidos, la cantidad de posibles estructuras de secuencia es enorme. Por supuesto, los investigadores recurrieron a las computadoras, pero los primeros intentos de usarlas para predecir estructuras de proteínas en las décadas de 1980 y 1990 produjeron malos resultados.

Según el Laboratorio Europeo de Biología Molecular (EMBL), con el que trabaja DeepMid, alrededor del 35 por ciento. las predicciones del catálogo que acabamos de hacer son muy precisas, lo que significa que son tan buenas como las estructuras determinadas experimentalmente. Otro 45 por ciento. han demostrado ser lo suficientemente confiables como para ser confiables en muchas aplicaciones.

Fuente: Science, New Scientist, The Guardian, foto: DeepMind. La foto muestra la estructura de la proteína vitelogenina, un precursor de la yema de huevo, según lo previsto por AlphaFold.

Leave a Reply

Your email address will not be published. Required fields are marked *

*