Převratný nástroj PolyGenie zjednodušuje analýzu genomických dat a odhaluje skryté souvislosti nemocí
InovaceTým GCAT|Genomes for Life z Výzkumného institutu Germans Trias i Pujol (IGTP) vyvinul PolyGenie, nový otevřený nástroj navržený k usnadnění zkoumání a opětovného použití genomických dat vědeckou komunitou.
Tým GCAT|Genomes for Life z Výzkumného institutu Germans Trias i Pujol (IGTP) vyvinul PolyGenie, nový otevřený nástroj navržený k usnadnění zkoumání a opětovného použití genomických dat vědeckou komunitou. Tato iniciativa představuje další krok ve strategii projektu na podporu principů FAIR dat (Findable, Accessible, Interoperable, Reusable), znovu použitelných zdrojů a otevřených infrastruktur pro biomedicínský výzkum. Platforma a její aplikace na kohortu GCAT jsou popsány v článku publikovaném v časopise NAR Genomics and Bioinformatics.
Generování dat je pouze prvním krokem ve vědeckém procesu. Jejich hodnota se výrazně zvyšuje, když mohou být data znovu použita, kombinována s jinými zdroji informací a transformována v nové poznatky. S touto vizí přispěl tým GCAT k vývoji PolyGenie, nástroje navrženého k usnadnění analýzy, zkoumání a opětovného použití genomických dat. Platforma byla vytvořena pro podporu takzvaných fenom-širokých asociačních studií (PheWAS), přístupu, který umožňuje výzkumníkům analyzovat, jak je genetická predispozice k určité nemoci nebo vlastnosti spojena se stovkami nebo tisíci dalších fenotypů, včetně nemocí, faktorů životního stylu a molekulárních dat. K tomu PolyGenie využívá polygenní rizikové skóre (PRS), které integruje účinky tisíců genetických variant k odhadu náchylnosti k různým vlastnostem a nemocem.
Pro demonstraci svých schopností vědci aplikovali PolyGenie na data z kohorty GCAT, populační studie zahrnující téměř 20 000 jedinců ve věku 40 až 65 let v Katalánsku. Pro tuto implementaci bylo analyzováno téměř 5 000 genotypovaných účastníků, kombinujících 135 polygenních rizikových skóre s 1 483 různými fenotypy, včetně nemocí, proměnných životního stylu a metabolomických dat. To umožnilo vyhodnocení více než 200 000 potenciálních asociací mezi genetickým rizikem a širokou škálou charakteristik souvisejících se zdravím. Jako příklad tým zkoumal vztahy mezi rizikovým skóre spojeným s křehkostí a různými klinickými výsledky. Analýzy ukázaly, že prevalence obezity progresivně rostla s rostoucím genetickým rizikem křehkosti. Byla také pozorována souvislost mezi tímto genetickým rizikem a závažnou depresivní poruchou, s vyšší prevalencí u žen. Tento typ analýzy ilustruje schopnost PolyGenie identifikovat sdílené vzorce mezi nemocemi a biologickými faktory, což usnadňuje generování nových výzkumných hypotéz.
PolyGenie vyplňuje mezeru v systematické aplikaci analýz polygenního rizikového skóre napříč různými kohortami. Jedná se o open-source nástroj vyvinutý s Nextflow, navržený k analýze polygenních rizikových skóre bez ohledu na použitou metodu jejich generování, což usnadňuje jeho použití v různých výzkumných prostředích. Další silnou stránkou platformy je, že obsahuje interaktivní vizualizační nástroje, které usnadňují zkoumání výsledků. Navíc se snadno přizpůsobí novým kohortám prostřednictvím konfiguračních souborů a metadat, aniž by bylo nutné upravovat kód. Pro GCAT tato iniciativa představuje další krok vpřed v budování otevřených zdrojů pro výzkum. V posledních letech se kohorta vyvinula z populačního zdroje ve vědeckou platformu, která podporuje odpovědné opětovné použití dat, spolupráci mezi institucemi a vývoj nových zdrojů pro výzkumnou komunitu. PolyGenie je příkladem této evoluce, transformující komplexní genomické informace v přístupnější zdroj pro výzkumníky pracující v oblastech, jako je precizní medicína, populační genetika a studium biologických determinantů zdraví.