Umělá inteligence HELIX mění medicínu: Přesně předpovídá sestřih RNA a pomáhá v boji s rakovinou
InovaceRNA hraje klíčovou roli v překladu genetického kódu z DNA do proteinů, které plní nespočet funkcí v těle. Jeden gen však nemusí produkovat pouze jednu variantu RNA.
RNA hraje klíčovou roli v překladu genetického kódu z DNA do proteinů, které plní nespočet funkcí v těle. Jeden gen však nemusí produkovat pouze jednu variantu RNA. Proces sestřihu RNA, při kterém se spojují různé kódující segmenty (exony) po odstranění nekódujících oblastí (intronů), umožňuje vznik široké škály izoforem RNA s odlišnými sekvencemi a funkcemi, specifickými pro tkáně a typy buněk. Tato alternativní forma sestřihu prekurzorové mRNA (pre-mRNA) výrazně zvyšuje složitost lidského transkriptomu. Změny v izoformách mohou citlivě odrážet dynamické změny v buněčných stavech a jejich dysregulace je úzce spojena s vážnými onemocněními, jako je rakovina.
Přesné charakterizování a předpovídání sestřihu RNA a využití izoforem napříč tkáněmi, buněčnými typy a chorobnými stavy bylo pro vědce dosud velkou výzvou. Je to dáno tím, že využití izoforem je regulováno mnoha vrstvami kontroly, včetně regulačních prvků (např. zesilovačů a tlumičů sestřihu na exonech a intronech), RNA-vazebných proteinů (RBP) a tkáňového mikroprostředí.
Nyní však výzkumníci z Čínského národního centra pro bioinformaci, pod vedením profesora Gao Yuana, vyvinuli inovativní rámec poháněný umělou inteligencí. Tento systém umožňuje vysoce přesnou předpověď sestřihu RNA a využití izoforem integrací genomických sekvenčních vlastností s tkáňově specifickými profily exprese RBP. Studie, která byla publikována v časopise Nature Computational Science, nabízí cenné poznatky pro pochopení regulačních vzorců sestřihu, interpretaci patogenních variant a výzkum v oblasti precizní medicíny.
Rámec nazvaný HELIX (Hierarchical Explainable LSTM for Isoform eXpression) překonává omezení konvenčních přístupů díky dvouvrstvé architektuře hlubokého učení. Nejprve integruje informace o DNA sekvenci s profily exprese 1 499 RBP a následně využívá sítě LSTM (long short-term memory) k efektivnímu zachycení složitých závislostí a konkurenčních vztahů mezi více místy sestřihu. Tento inovativní design umožňuje přesnou a spolehlivou předpověď sestřihu RNA a využití transkriptových izoforem. Model byl trénován a optimalizován na rozsáhlých souborech dat RNA-seq (krátkých i dlouhých čtení) pokrývajících 30 různých lidských tkání, což umožnilo přesnou kvantifikaci složitých transkriptových struktur a využití izoforem. Výsledky ukazují, že HELIX výrazně překonává stávající hlavní metody jak v předpovědi síly sestřihu, tak v celkové předpovědi využití izoforem.
V rámci studií souvisejících s nemocemi prokázal HELIX silnou schopnost dešifrovat aberantní sestřih RNA a změny transkriptových izoforem. Například při použití velkých kohort pacientů s kolorektálním karcinomem vědci identifikovali rozsáhlou dysregulaci sestřihu a abnormální využití izoforem v nádorových buňkách. Výsledky odhalují silné korelace mezi těmito změnami a genomickými mutacemi, dysregulací RBP a klinickými profily pacientů. Tyto poznatky naznačují, že abnormality sestřihu mohou sloužit jako zásadní molekulární markery pro pochopení progrese nádoru a pro vedení stratifikace pacientů.