Proteiny jsou malé „stroje“, které v našem těle plní téměř všechny funkce. Jejich trojrozměrné tvary určují, jak se vzájemně ovlivňují a fungují. Pochopení těchto tvarů nebo struktur je klíčem k pokroku v medicíně a biologii. Tradičně bylo stanovení proteinové struktury proces náročný na práci. Výkonné algoritmy strojového učení, jako je AlphaFold2, však způsobily revoluci v oboru tím, že umožnily vysoce přesnou predikci proteinových struktur na základě jejich aminokyselinových sekvencí.

V roce 2022 byla spuštěna databáze AlphaFold Protein Structures, která poskytuje předpokládané struktury pro téměř všechny v té době známé proteiny. Ačkoli se jednalo o průlomový úspěch, zdroj představoval výzvu: neaktualizoval se automaticky, když byly objeveny nové proteinové sekvence nebo byly stávající zpřesněny pomocí novějších dat. To znamenalo, že strukturální modely mohly rychle zastarat, což by mohlo vést k chybám ve výzkumu a následných aplikacích.

Nová bezplatná databáze AlphaSync, kterou vyvinuli vědci z dětské nemocnice St. Jude pro výzkum rakoviny, řeší tuto kritickou mezeru. AlphaSync neustále aktualizuje svou sbírku 2,6 milionu předpokládaných proteinových struktur napříč stovkami druhů.

Jak AlphaSync funguje?

Představte si neustálou kontrolu kvality proteinových struktur. To je v podstatě to, co AlphaSync dělá. Je propojena s UniProt, největší světovou databází proteinových sekvencí. Kdykoli jsou v UniProt k dispozici nové nebo upravené sekvence, AlphaSync automaticky spustí opakované předpovědi struktury pro odpovídající proteiny, což zajišťuje, že výzkumníci mají vždy přístup k nejaktuálnějším a nejpřesnějším modelům.

Proč je to důležité?

Představte si toto: Spoléhání se na zastaralé mapy by učinilo navigaci nespolehlivou. Stejně tak použití proteinových struktur, které neodrážejí nejnovější vědecké důkazy, může vést k falešným interpretacím a bránit pokroku ve výzkumu. V rychle se vyvíjejícím oboru, jako je strukturální biologie, je přístup k aktuálním informacím zásadní.

„V rychle se měnícím vědeckém prostředí je přístup k nejaktuálnějším a nejpodrobnějším informacím o modelech struktury proteinů nezbytný pro průlomy v medicíně a biologii,“ vysvětluje Dr. M. Madan Babu, hlavní spoluautor studie a hlavní datový vědec z nemocnice St. Jude pro výzkum rakoviny.

Kromě aktualizovaných struktur: rozšířená funkčnost

AlphaSync nejenže poskytuje aktualizované struktury; také zjednodušuje proces výzkumu tím, že nabízí předem vypočítaná data a uživatelsky přívětivé funkce. To zahrnuje informace o interakcích aminokyselin, povrchové dostupnosti a konformačních stavech – kritické detaily, které výzkumníci často potřebují prostudovat hlouběji, aby pochopili funkci proteinů. Tým dokonce zjednodušil složitá 3D strukturální data do lépe analyzovatelného 2D tabulkového formátu, což usnadnilo integraci s dalšími nástroji, včetně algoritmů strojového učení.

AlphaSync představuje významný pokrok v poskytování nejpřesnějších a aktuálních údajů o proteinových strukturách výzkumníkům. Nepřetržitou aktualizací databáze a začleňováním uživatelsky přívětivých funkcí umožňuje AlphaSync vědcům zkoumat složitost proteinů s větší jistotou a účinností, což v konečném důsledku urychluje pokrok směrem k lepší léčbě nemocí.