Las proteínas son las pequeñas máquinas que llevan a cabo prácticamente todas las funciones dentro de nuestro cuerpo. Sus formas tridimensionales determinan cómo interactúan y funcionan. Comprender estas formas o estructuras es crucial para los avances en medicina y biología. Tradicionalmente, determinar la estructura de una proteína ha sido un proceso laborioso. Sin embargo, potentes algoritmos de aprendizaje automático como AlphaFold2 han revolucionado el campo, permitiendo predicciones muy precisas de estructuras de proteínas basadas únicamente en sus secuencias de aminoácidos.

En 2022, se lanzó la base de datos de estructuras de proteínas AlphaFold, que proporciona estructuras previstas para casi todas las proteínas conocidas en ese momento. Si bien fue innovador, este recurso presentó un desafío: no se actualizaba automáticamente cuando se descubrían nuevas secuencias de proteínas o las existentes se refinaban con datos más nuevos. Esto significa que los modelos estructurales podrían quedar obsoletos rápidamente, lo que podría provocar imprecisiones en la investigación y las aplicaciones posteriores.

Ingrese a AlphaSync, una nueva base de datos gratuita desarrollada por científicos del St. Jude Children’s Research Hospital. Para abordar esta brecha crítica, AlphaSync actualiza continuamente su colección de 2,6 millones de estructuras proteicas previstas en cientos de especies.

¿Cómo funciona AlphaSync?

Imagine un control de calidad constante de las estructuras proteicas. Eso es esencialmente lo que hace AlphaSync. Está vinculado a UniProt, la base de datos de secuencias de proteínas más grande del mundo. Cada vez que aparecen secuencias nuevas o modificadas en UniProt, AlphaSync vuelve a ejecutar automáticamente las predicciones estructurales para las proteínas afectadas, lo que garantiza que los investigadores siempre tengan acceso a los modelos más actualizados y precisos.

¿Por qué es esto importante?

Piénselo así: depender de mapas obsoletos haría que la navegación no fuera confiable. De manera similar, el uso de estructuras proteicas que no reflejan los últimos descubrimientos científicos podría dar lugar a interpretaciones erróneas y obstaculizar el progreso de la investigación. En un campo en rápida evolución como la biología estructural, tener acceso a información actualizada es primordial.

“En un panorama científico en rápida evolución, tener acceso a la información más actualizada y detallada sobre los modelos estructurales de proteínas es esencial para lograr avances en medicina y biología”, explica el Dr. M. Madan Babu, coautor principal del estudio y científico jefe de datos del St. Jude Children’s Research Hospital.

Más allá de las estructuras actualizadas: funcionalidad mejorada

AlphaSync no sólo proporciona estructuras actualizadas; También agiliza el proceso de investigación al ofrecer datos precalculados y funciones fáciles de usar. Esto incluye información sobre las interacciones de los aminoácidos, la accesibilidad a la superficie y los estados conformacionales, detalles cruciales que los investigadores a menudo necesitan para profundizar en la función de las proteínas. El equipo incluso ha simplificado los complejos datos estructurales 3D a un formato tabular 2D más accesible, lo que facilita a los investigadores el análisis y la integración con otras herramientas, incluidos los algoritmos de aprendizaje automático.

AlphaSync representa un avance significativo al proporcionar a los investigadores la información más precisa y oportuna sobre las estructuras de las proteínas. Al actualizar continuamente su base de datos e incorporar funciones fáciles de usar, AlphaSync permite a los científicos explorar las complejidades de las proteínas con mayor confianza y eficiencia, lo que en última instancia acelera el progreso hacia mejores tratamientos para las enfermedades.