Umělá inteligence se učí objevovat novou fyziku, ale musí se zbavit starých návyků
InovaceVědci zkoumají, jak může umělá inteligence (AI) dramaticky snížit výpočetní náklady při hledání nové fyziky, která přesahuje standardní kosmologický model.
Vědci zkoumají, jak může umělá inteligence (AI) dramaticky snížit výpočetní náklady při hledání nové fyziky, která přesahuje standardní kosmologický model. Zároveň ale odhalili nečekané riziko: AI systémy se někdy mohou až příliš spoléhat na to, co už vědí, což může bránit v rozpoznání skutečně nových jevů.
Standardní kosmologický model, známý jako ΛCDM, úspěšně popisuje mnoho vlastností vesmíru, od jeho rozpínání po rozložení galaxií. Fyzici však vědí, že je pravděpodobně neúplný. Nedávná pozorování naznačují, že jevy jako hmotná neutrina, modifikovaná gravitace nebo vyvíjející se temná energie by mohly poukazovat na novou fyziku. Testování těchto alternativ vyžaduje spuštění obrovského množství vysoce přesných simulací virtuálních vesmírů za různých fyzikálních předpokladů, což je extrémně náročné na výpočetní zdroje.
Nový výzkum se zaměřuje na techniku zvanou transfer learning, která umožňuje AI systémům znovu použít znalosti získané z jedné úlohy k urychlení učení v jiné. Vědci nejprve natrénovali neuronovou síť na simulacích založených na modelu ΛCDM a poté ji adaptovali na složitější kosmologické modely, které zahrnují potenciální novou fyziku. Adrian Bayer, kosmolog z Flatiron Institute a Princetonské univerzity a spoluautor studie, to přirovnává ke studiu obtížného předmětu: „Nejprve si přečtete základní knihu, abyste získali představu o znalostech, a pak přejdete ke skutečně složité knize.“ Tato strategie může výrazně snížit počet potřebných drahých simulací, v některých případech až desetinásobně.
Studie však odhalila i fenomén známý jako negativní transfer. Někdy se účinky produkované novou fyzikou velmi podobají vzorcům již spojeným se standardním kosmologickým modelem. V takových případech má AI tendenci interpretovat nové informace pomocí kategorií naučených během předtréninku, což ztěžuje rozpoznání skutečně nových efektů. Tento jev byl pozorován u simulací zahrnujících hmotná neutrina, kde se jejich účinky podobaly variacím spojeným s existujícím parametrem ΛCDM známým jako σ8. Veena Krishnaraj, studentka z Princetonské univerzity a první autorka práce, zdůrazňuje, že negativní transfer není náhodný, ale je řízen základními fyzikálními degeneracemi v modelu. To znamená, že různé fyzikální parametry mohou vytvářet velmi podobné pozorovatelné efekty, což AI ztěžuje jejich správné rozlišení.
Tato práce zdůrazňuje jak slib, tak rizika uplatnění strategií „základních modelů“ – koncepčně podobných těm, které stojí za moderní generativní AI a velkými jazykovými modely – ve fundamentální fyzice. Předtrénink může urychlit odvozování, ale může také bránit učení se nové fyziky. Metoda byla zatím testována na simulacích a pokládá základy pro aplikaci na reálná pozorovací data. Vědci ji považují za mocný nástroj pro budoucí kosmologické průzkumy, které v nadcházejících letech vygenerují bezprecedentní množství vysoce přesných dat o vesmíru.