Překvapivá zjištění Microsoftu: Špičkové AI systémy v práci poškozují čtvrtinu dokumentů
InovaceNedávná studie, kterou provedli výzkumníci z Microsoftu, odhalila zásadní slabiny současných špičkových systémů umělé inteligence při plnění komplexních úkolů na pracovišti.
Nedávná studie, kterou provedli výzkumníci z Microsoftu, odhalila zásadní slabiny současných špičkových systémů umělé inteligence při plnění komplexních úkolů na pracovišti. Podle dosud neověřené studie, na kterou upozornil magazín IT Pro, modely jako OpenAI GPT 5.4, Anthropic Claude Opus 4.6 a Google Gemini 3.1 Pro v průměru poškodily 25 procent obsahu dokumentů během složitých zadání. Starší modely si vedly ještě hůře.
Zjištění jsou obzvláště pozoruhodná vzhledem k tomu, že Microsoft masivně investuje do umělé inteligence a aktivně ji integruje do svého operačního systému Windows 11. Výzkumníci, kteří měli veškerou motivaci najít pozitivní výsledky, dospěli k závěru, že tyto modely „nejsou připraveny na delegované pracovní postupy ve většině oblastí“. Zajímavostí je, že studie nehodnotila vlastní AI systém Copilot od Microsoftu.
Tyto výsledky naznačují, že slepé spoléhání na velké jazykové modely (LLM) pro zpracování interních dokumentů může vést k chybám a potenciální ztrátě dat. Studie tak přispívá k rostoucímu množství poznatků o takzvaném „workslopu“ – nekvalitním obsahu generovaném umělou inteligencí, který musí následně opravovat lidští pracovníci. Zatímco mnoho firem usiluje o nahrazení lidské práce umělou inteligencí, tato zjištění zdůrazňují potřebu opatrnosti a důkladné lidské kontroly při nasazování AI pro komplexní úkoly. Pochopení těchto omezení je klíčové pro efektivní a zodpovědné využívání AI technologií v pracovním prostředí.
Futurism