Vědci překvapili: AI simuluje molekuly bez předem daných fyzikálních zákonů, stačí jí data
InovaceSimulace pohybu atomů a molekul v čase představuje klíčovou výzvu v oblasti výpočetní chemie a materiálových věd.
Simulace pohybu atomů a molekul v čase představuje klíčovou výzvu v oblasti výpočetní chemie a materiálových věd. Klasické přístupy strojového učení k molekulární dynamice (MD) tradičně zabudovávají základní fyzikální principy, jako je zachování energie a ekvivariance (požadavek, aby předpovídané síly zůstaly konzistentní bez ohledu na orientaci molekuly v prostoru), přímo do architektury svých modelů. Tyto takzvané induktivní předpoklady byly dlouho považovány za nezbytné pro spolehlivé a fyzikálně smysluplné MD modely.
Tým vědců, včetně Maxe Eisslera, Tima Korjakowa a Stefana Guglera z BIFOLD a Google DeepMind, však vyvinul nový přístup, který tyto fyzikální omezení záměrně odstraňuje. Jejich model, nazvaný MD-ET, je postaven na standardní architektuře transformátoru (edge transformer), která byla pro oblast MD jen minimálně upravena a neimplementuje ani vestavěnou ekvivarianci, ani zachování energie. Místo toho se spoléhá na učení fyzikálního chování z obrovského množství dat, konkrétně z přibližně 30 milionů molekulárních struktur z databáze QCML.
Výsledky jsou pozoruhodné. Na několika zavedených benchmarcích dosahuje MD-ET konkurenčního nebo špičkového výkonu. Model se učí předpovídat síly, které jsou přibližně ekvivariantní, s odchylkami o mnoho řádů nižšími než typické velikosti sil. Stabilní simulace NVT (kde je teplota a počet částic konstantní) uspěly i v režimu s malým počtem vzorků. Klíčovými faktory těchto výsledků jsou podle autorů velký předtréninkový dataset a relativní snadnost optimalizace transformátorů. Situace je však složitější u simulací NVE (systémy s pevnou energií a bez termostatu). Zde je zachování energie naučeno pouze přibližně a ukazuje se jako citlivé na velikost molekuly i na numerické poruchy. U větších struktur model vykazuje nekontrolovatelný nárůst energie, což poukazuje na skutečné omezení tohoto neomezeného přístupu. Autoři zdůrazňují, že MD simulace využívající nekonzervativní síly by měly být pečlivě ověřovány pro každý případ zvlášť.
Tyto poznatky přispívají k probíhající diskusi v oboru o tom, do jaké míry jsou fyzikální induktivní předpoklady nezbytnými součástmi MD modelů, nebo zda dostatečně expresivní univerzální architektury trénované na velkých datových souborech dokážou naučit respektovat fyzikální principy, aniž by k tomu byly explicitně nuceny. Model MD-ET naznačuje, že pro mnoho praktických aplikací může být dosaženo druhého jmenovaného, zároveň však jasně vymezuje současné hranice tohoto přístupu.
Phys.org