Les protéines sont de minuscules machines qui remplissent pratiquement toutes les fonctions de notre corps. Leurs formes tridimensionnelles déterminent la façon dont ils interagissent et fonctionnent. Comprendre ces formes, ou structures, est crucial pour les progrès de la médecine et de la biologie. Traditionnellement, déterminer la structure d’une protéine est un processus laborieux. Cependant, de puissants algorithmes d’apprentissage automatique comme AlphaFold2 ont révolutionné le domaine, permettant des prédictions très précises des structures protéiques basées uniquement sur leurs séquences d’acides aminés.

En 2022, la base de données sur la structure des protéines AlphaFold a été lancée, fournissant des structures prédites pour presque toutes les protéines connues à cette époque. Bien qu’innovante, cette ressource présentait un défi : elle n’était pas automatiquement mise à jour lorsque de nouvelles séquences protéiques étaient découvertes ou que celles existantes étaient affinées avec des données plus récentes. Cela signifie que les modèles structurels pourraient rapidement devenir obsolètes, ce qui pourrait entraîner des inexactitudes dans la recherche et les applications en aval.

Entrez AlphaSync, une nouvelle base de données gratuite développée par des scientifiques du St. Jude Children’s Research Hospital. Pour combler cette lacune critique, AlphaSync met continuellement à jour sa collection de 2,6 millions de structures protéiques prévues parmi des centaines d’espèces.

Comment fonctionne AlphaSync ?

Imaginez un contrôle qualité permanent des structures protéiques. C’est essentiellement ce que fait AlphaSync. Il est lié à UniProt, la plus grande base de données mondiale de séquences protéiques. Chaque fois que des séquences nouvelles ou modifiées apparaissent dans UniProt, AlphaSync réexécute automatiquement les prédictions de structure pour les protéines affectées, garantissant ainsi aux chercheurs d’avoir toujours accès aux modèles les plus récents et les plus précis.

Pourquoi est-ce important ?

Pensez-y comme ceci : s’appuyer sur des cartes obsolètes rendrait la navigation peu fiable. De même, l’utilisation de structures protéiques qui ne reflètent pas les dernières découvertes scientifiques pourrait conduire à des interprétations erronées et entraver les progrès de la recherche. Dans un domaine en évolution rapide comme la biologie structurale, avoir accès à des informations à jour est primordial.

« Dans un paysage scientifique en évolution rapide, avoir accès aux informations les plus récentes et les plus détaillées sur les modèles structurels des protéines est essentiel pour les percées en médecine et en biologie », explique le Dr M. Madan Babu, auteur co-correspondant principal de l’étude et scientifique en chef des données à l’hôpital de recherche pour enfants St. Jude.

Au-delà des structures simplement mises à jour : fonctionnalités améliorées

AlphaSync ne fournit pas seulement des structures mises à jour ; il rationalise également le processus de recherche en offrant des données précalculées et des fonctionnalités conviviales. Cela inclut des informations sur les interactions des acides aminés, l’accessibilité de la surface et les états conformationnels – des détails cruciaux dont les chercheurs ont souvent besoin pour approfondir la fonction des protéines. L’équipe a même simplifié les données structurelles 3D complexes dans un format tabulaire 2D plus accessible, facilitant ainsi l’analyse et l’intégration des chercheurs à d’autres outils, notamment des algorithmes d’apprentissage automatique.

AlphaSync représente une avancée significative en fournissant aux chercheurs les informations les plus précises et les plus actuelles sur les structures des protéines. En mettant continuellement à jour sa base de données et en intégrant des fonctionnalités conviviales, AlphaSync permet aux scientifiques d’explorer les subtilités des protéines avec plus de confiance et d’efficacité, accélérant ainsi les progrès vers de meilleurs traitements contre les maladies.