Proč AI potřebuje „vnitřní tělesné vnímání“? Vědci z UCLA navrhují klíč k bezpečnější umělé inteligenci
InovaceSoučasné modely umělé inteligence, jako jsou ChatGPT a Gemini, jsou zásadně omezené, protože jim chybí „vnitřní tělesné vnímání“. To znamená, že i když dokážou dokonale popsat sklenici vody, nemají vnitřní stav „žízně“, který by reguloval jejich chování.
Současné modely umělé inteligence, jako jsou ChatGPT a Gemini, jsou zásadně omezené, protože jim chybí „vnitřní tělesné vnímání“. To znamená, že i když dokážou dokonale popsat sklenici vody, nemají vnitřní stav „žízně“, který by reguloval jejich chování. Nová studie z UCLA Health tvrdí, že bez těchto vnitřních „zranitelností“ a samoregulačních mechanismů bude AI náchylná k přehnaně sebevědomým chybám a bude mít potíže se skutečným sladěním s lidskými hodnotami.
Lidský mozek při jednoduché akci, jako je sáhnutí po slánce, nejen vypočítává souřadnice, ale také se opírá o smysl pro rovnováhu, tření na kůži a vnitřní úroveň žízně či únavy. Tělo a mozek pracují jako jeden celek, čerpajíce z celoživotní tělesné zkušenosti. Dnešní nejpokročilejší systémy umělé inteligence však takové tělesné mechanismy postrádají, což má podle vědců významné důsledky pro jejich chování, bezpečnost a důvěryhodnost.
Studie rozlišuje mezi externím tělesným vnímáním (interakce s fyzickým světem) a vnitřním tělesným vnímáním (neustálé monitorování vnitřních stavů, jako je únava, nejistota nebo potřeba). Vědci testovali přední modely AI pomocí „bodových světelných displejů“ – teček, které naznačují lidskou postavu. Zatímco i lidští novorozenci postavu rozpoznají, modely AI selhaly a někdy popsaly tečky jako „souhvězdí hvězd“. Když byl obraz otočen o pouhých 20 stupňů, i nejlepší modely se zhroutily. Lidé v tomto testu neuspějí, protože jejich vnímání je ukotveno v celoživotní tělesné zkušenosti.
U lidí funguje tělo jako vestavěný bezpečnostní systém. Pokud jsme „vyčerpaní“ nebo „nejistí“, naše tělo to zaznamená a reguluje naše chování. AI postrádá tuto „vnitřní cenu“, což znamená, že nemá žádný vnitřní důvod vyhýbat se přehnaně sebevědomým chybám, když ve skutečnosti jen hádá. Bez vnitřních nákladů nebo omezení nemá systém AI žádný vnitřní důvod, proč by se měl vyhýbat přehnaně sebevědomým chybám, odolávat manipulaci nebo se chovat konzistentně.
Výzkumníci z UCLA proto navrhují nový architektonický rámec pro AI, nazvaný „duální rámec tělesného vnímání“. Ten by sledoval „syntetické“ vnitřní stavy, jako je zatížení zpracování a úroveň jistoty, aby omezoval chování systému v průběhu času. Autoři také navrhují nové standardy pro hodnocení, které by měřily, zda AI dokáže monitorovat své vlastní vnitřní stavy a udržovat stabilitu, namísto pouhého testování schopnosti identifikovat objekty nebo složit zkoušky. Cílem je vytvořit AI, která je skutečně sladěna s lidským chováním a má vnitřní samoregulační mechanismy.
Neuroscience News