AI mění screening deprese: Rozhovor s umělou inteligencí je přesnější a příjemnější než klasické dotazníky
ZdravíTradiční hodnotící škály, které se v psychologickém hodnocení používají déle než sto let, často omezují, jak lidé mohou vyjádřit své složité a nuancované duševní stavy.
Tradiční hodnotící škály, které se v psychologickém hodnocení používají déle než sto let, často omezují, jak lidé mohou vyjádřit své složité a nuancované duševní stavy. Nová studie představuje inovativní přístup, který kombinuje velké jazykové modely s tradičními psychometrickými nástroji pro screening deprese, čímž výrazně zlepšuje přesnost i uživatelský komfort.
Vědci z Zhengzhou Normal University vyvinuli takzvané Automatizované hodnotící paradigma (AAP). To integruje ověřenou sedmipoložkovou škálu Beck Depression Inventory Fast Screen (BDI-FS) do vlastního rozhraní založeného na ChatGPT, nazvaného BDI-FS-GPT. Namísto výběru z pevných možností odpovědí AI agent předkládá sérii předdefinovaných otázek a analyzuje přirozené, otevřené odpovědi uživatelů. Systém poté přiřazuje standardizované skóre škály tím, že mapuje celkový význam těchto odpovědí na původní bodovací kotvy BDI-FS prostřednictvím deterministického procesu založeného na pravidlech.
Pro ověření účinnosti nástroje se výzkumný tým zaměřil na 115 účastníků, z nichž 28 mělo diagnostikovanou depresi. Účastníci absolvovali jak hodnocení pomocí AI-řízeného BDI-FS-GPT, tak standardní dotazník Patient Health Questionnaire-9 (PHQ-9). Výsledky obou hodnocení byly následně porovnány s diagnózami stanovenými licencovanými psychiatry.
Výsledky ukázaly, že BDI-FS-GPT dosáhlo významné shody s klinickými diagnózami. Při optimálním hraničním skóre nástroj identifikoval 89,3 % účastníků s depresí, přičemž udržel míru falešně pozitivních výsledků na 11,5 %. Pro srovnání, tradiční PHQ-9 vykázalo 71,4 % shodu s klinickými diagnózami a nižší plochu pod křivkou 0,859.
Uživatelská zkušenost také jednoznačně favorizovala konverzační formát. V samostatném hodnocení spokojenosti účastníci uvedli mírně, ale významně vyšší spokojenost s hodnocením BDI-FS-GPT než s tradičním formátem BDI-FS. Autoři studie zdůrazňují, že přijetí a komfort mohou ovlivnit ochotu lidí vůbec se zapojit do screeningu duševního zdraví. Naznačují také, že nástroje jako BDI-FS-GPT by se mohly v budoucnu používat jako screening před návštěvou lékaře nebo v čekárnách, což by klinikám pomohlo identifikovat osoby, které mohou potřebovat další vyšetření, a zároveň by snížilo zátěž personálu a nabídlo více na pacienta zaměřený zážitek z hodnocení. Autoři však upozorňují, že systém je určen k podpoře klinického screeningu, nikoli k nahrazení úsudku lékaře. Studie se zaměřila na dospělé v jednom klinickém prostředí a z bezpečnostních důvodů vyloučila závažné případy, takže je stále nutná širší validace.
Medical Xpress