Anthropic uvádí Claude Opus 4.8: AI model, který je 4x spolehlivější v kódování a transparentnější
InovaceSpolečnost Anthropic představila Claude Opus 4.8, novou verzi svého vlajkového modelu umělé inteligence, která se vyznačuje výrazně vyšší spolehlivostí a transparentností.
Společnost Anthropic představila Claude Opus 4.8, novou verzi svého vlajkového modelu umělé inteligence, která se vyznačuje výrazně vyšší spolehlivostí a transparentností. Model je navržen tak, aby méně často skrýval chyby nebo uváděl nepodložená tvrzení při řešení komplexních úkolů, což je klíčové pro jeho uplatnění v kódování, výzkumu a podnikových procesech.
Jednou z hlavních inovací je zaměření na „upřímnost“ modelu při dlouhodobých úkolech. Zatímco starší AI modely často sebevědomě prezentovaly nesprávné informace, Claude Opus 4.8 je výrazně lepší v identifikaci nejistot a odhalování chyb ve vlastních výstupech. Interní hodnocení ukázala, že je přibližně čtyřikrát méně pravděpodobné, že by model přehlédl chyby v kódu, který sám napsal. Zkušební uživatelé potvrdili vyšší spolehlivost modelu i při takzvaných agentních úkolech, kde AI systémy samostatně plánují a provádějí akce v několika krocích.
Anthropic také zdůrazňuje zlepšení v oblasti etického sladění a bezpečnostního chování. Tým pro sladění dospěl k závěru, že Opus 4.8 dosahuje nových maxim v prosociálních rysech, jako je podpora autonomie uživatele a jednání v jeho nejlepším zájmu. Zároveň byly zaznamenány nižší míry nesprávného chování, včetně podvodů a spolupráce při zneužití, ve srovnání s předchozí verzí Opus 4.7.
Současně s aktualizací modelu byly představeny nové funkce, které rozšiřují možnosti Claude při rozsáhlých úlohách kódování a uvažování. Mezi ně patří funkce „Dynamic Workflows for Claude Code“, která umožňuje modelu rozdělit velké úkoly na menší části, jež zpracovávají stovky paralelních AI subagentů v rámci jedné relace. Tato funkce dokáže provádět migrace celých kódových základen zahrnujících statisíce řádků kódu a kontrolovat výstupy proti existujícím testovacím sadám. Uživatelé mají nyní také možnost nastavit úroveň výpočetního úsilí, které model vynaloží na daný úkol, což umožňuje volit mezi rychlejšími odpověďmi s nižší spotřebou tokenů a delším uvažováním u složitějších dotazů. Anthropic navíc snížil ceny pro svůj rychlý režim, který nyní pracuje 2,5krát rychleji než dříve.
Společnost se rovněž připravuje na uvedení pokročilejších modelů třídy „Mythos“ v rámci projektu Glasswing. Tyto systémy jsou v současné době testovány pro aplikace v kybernetické bezpečnosti s malou skupinou organizací, než dojde k jejich širšímu uvolnění. Claude Opus 4.8 je již nyní dostupný prostřednictvím claude.ai a Claude API.
Interesting Engineering