Umělá inteligence o1-preview diagnostikuje pacienty na pohotovosti přesněji než lékaři
InovaceLékaři na pohotovosti čelí zásadním rozhodnutím v rychlém a často chaotickém prostředí. Musí rychle určit, který pacient naléhavě potřebuje péči, co mu je a jak postupovat dál. V těchto situacích by jim mohla pomoci umělá inteligence.
Lékaři na pohotovosti čelí zásadním rozhodnutím v rychlém a často chaotickém prostředí. Musí rychle určit, který pacient naléhavě potřebuje péči, co mu je a jak postupovat dál. V těchto situacích by jim mohla pomoci umělá inteligence. Nový model o1-preview od společnosti OpenAI, představený v roce 2024, se v sérii náročných scénářů vyrovnal nebo dokonce překonal lékaře v klinickém uvažování.
Model o1-preview, podobný těm, které pohánějí ChatGPT, Claude nebo Gemini, se odlišuje schopností „promýšlet“ problémy před zodpovězením. Tyto modely pro uvažování zkoumají více strategií, kontrolují se a revidují odpovědi, než dospějí k závěru, což se blíží lidskému způsobu řešení problémů. Při diagnostice problémů z databáze případových zpráv dosáhl o1-preview téměř 89procentní úspěšnosti. V reálných scénářích na pohotovosti umělá inteligence překonala lékaře ve fázi třídění, kdy se rozhoduje, který pacient potřebuje léčbu nejdříve.
Umělá inteligence již dříve excelovala u lékařských licenčních zkoušek a v jednoduchých klinických hodnoceních. Avšak „úspěšné složení zkoušek není totéž jako být lékařem, a prokázání výkonu na úrovni lékaře v autentických klinických úkolech je zásadně těžší výzva,“ uvedli Ashley Hopkins a Erik Cornelisse z Flinders University v Austrálii, kteří se studie nezúčastnili. To neznamená, že o1-preview je připravena pro klinickou praxi nebo že nahradí lékaře. Studie se spíše zaměřila na nastavení vyšší laťky pro systémy navržené k práci po boku lidí. Lékaři, stejně jako ostatní profese, začleňují AI do své práce, a otázkou zůstává, zda to zlepší nebo zhorší péči.
„Jsme svědky skutečně zásadní technologické změny, která přetvoří medicínu,“ řekl na tiskové konferenci autor studie Arjun Manrai z Harvard Medical School. Dlouhodobým cílem je vytvořit AI, která dokáže diagnostikovat pacienty v komplikovaných případech z reálného světa. Databáze klinicko-patologických případových konferencí z New England Journal of Medicine (NEJM) se dlouho používá k výuce mladých lékařů a představovala velkou výzvu pro počítačové systémy. O1-preview v ní dosáhl téměř 89procentní šance na perfektní nebo velmi blízkou diagnózu, zatímco GPT-4 dosáhl 73 procent. Model o1-preview také exceloval v otázkách týkajících se dalších diagnostických testů a kroků v léčbě, včetně výběru antibiotik nebo vedení obtížných rozhovorů o péči na konci života pacienta.
Největší výzvou byly případy zahrnující skutečné pacienty. „Reálný svět přináší nespočet rušivých elementů, a pokud někdo viděl moderní elektronickou zdravotní dokumentaci, říci, že tam jsou rušivé elementy, je upřímně řečeno podcenění,“ uvedl autor studie Peter Brodeur. Když tým předložil o1-preview 70 náhodně vybraných případů z pohotovosti v bostonské nemocnici, model překonal dva zkušené lékaře ve všech scénářích – třídění, vyšetření, kontrola dokumentace, rozhodnutí o přijetí či propuštění. Při zaslepeném hodnocení nedokázali hodnotitelé spolehlivě rozlišit výstupy AI od výstupů lékařů. Důležité je, že o1-preview dokázal vysvětlit své uvažování za konečným hodnocením a ukázat, jak zvážil podpůrné nebo vyvracející důkazy.