OpenAI představuje GPT-5.5: Nová AI s rekordním skóre v kódování zvládá složité úkoly téměř samostatně
InovaceSpolečnost OpenAI představila GPT-5.5, svůj dosud nejschopnější a nejintuitivnější model, který je navržen tak, aby uživatelům pomáhal s komplexními, vícekrokovými úkoly s větší samostatností.
Společnost OpenAI představila GPT-5.5, svůj dosud nejschopnější a nejintuitivnější model, který je navržen tak, aby uživatelům pomáhal s komplexními, vícekrokovými úkoly s větší samostatností. Toto vydání signalizuje pokračující posun směrem k autonomním systémům umělé inteligence, které dokáží plánovat, provádět a zdokonalovat práci s minimálním lidským zásahem.
Model výrazně zlepšuje interakci uživatelů s AI v oblastech kódování, výzkumu a obecné znalostní práce. Namísto vedení každého kroku mohou nyní uživatelé zadávat širší úkoly a spoléhat se na model, který se orientuje v nejednoznačnosti a dokončuje pracovní postupy. GPT-5.5 dosahuje výrazných pokroků v kódování, zejména u složitých pracovních postupů vyžadujících plánování a koordinaci nástrojů. V srovnávacím testu Terminal-Bench 2.0 dosáhl přesnosti 82,7 %, což je špičkové skóre. V testu SWE-Bench Pro dosáhl 58,6 % a vyřešil více reálných problémů z GitHubu v jediném průchodu než předchozí verze. Model také překonal svého předchůdce v dlouhodobých inženýrských úkolech, které lidským vývojářům často trvají až 20 hodin.
Zlepšení přesahují pouhé srovnávací testy. První testeři uvedli, že GPT-5.5 lépe rozumí architektuře systému a místům selhání. Dokáže identifikovat, kam patří opravy, a předvídat následné dopady napříč celým kódem. OpenAI zdůraznila efektivitu vedle schopností. GPT-5.5 dosahuje stejné latence na token jako GPT-5.4, a to i přes vyšší inteligenci. K dokončení stejných úkolů navíc používá méně tokenů, což snižuje výpočetní náklady.
Kromě kódování rozšiřuje GPT-5.5 svou roli v každodenní znalostní práci. Model se dokáže pohybovat mezi úkoly, jako je shromažďování informací, analýza dat a generování strukturovaných výstupů, například dokumentů a tabulek. To odráží širší posun směrem k systémům AI, které dokáží aktivně ovládat software a nástroje, interpretovat rozhraní, provádět akce a přecházet mezi pracovními postupy s minimálním třením.
Interní přijetí těchto schopností podtrhuje jejich význam. Více než 85 % zaměstnanců OpenAI nyní týdně používá Codex napříč odděleními, včetně inženýrství, financí a marketingu. Například komunikační tým použil GPT-5.5 ke zpracování dat o žádostech o vystoupení za šest měsíců, vytvořil rámec pro hodnocení a rizika a pomohl automatizovat schvalování s nízkým rizikem. Ve financích model zkontroloval 24 771 daňových formulářů K-1 o celkovém objemu více než 71 000 stránek. Tento pracovní postup vyloučil osobní údaje a zkrátil dobu zpracování o dva týdny. Další tým automatizoval týdenní obchodní reportování, čímž ušetřil pět až deset hodin každý týden.
OpenAI také zdůraznila bezpečnost při zavádění. Společnost uvedla, že nasadila dosud nejsilnější bezpečnostní opatření, včetně „red-teaming“, pokročilého testování a zpětné vazby od téměř 200 partnerů s předčasným přístupem. GPT-5.5 je nyní k dispozici uživatelům Plus, Pro, Business a Enterprise v ChatGPT a Codexu. Přístup k API bude následovat po splnění dalších bezpečnostních a škálovacích požadavků. Spuštění signalizuje pokračující zaměření OpenAI na budování infrastruktury pro autonomní AI, s cílem rozšířit způsob, jakým lidé a podniky využívají AI k dokončení komplexní práce napříč doménami.
Interesting Engineering