AI Mythos, kterou Anthropic označil za příliš nebezpečnou, se dostala k uživatelům Discordu
InovaceSpolečnost Anthropic nedávno představila svůj nový model umělé inteligence s názvem Mythos, který byl interně popsán jako tak výkonný, že je příliš nebezpečný pro široké veřejné uvolnění.
Společnost Anthropic nedávno představila svůj nový model umělé inteligence s názvem Mythos, který byl interně popsán jako tak výkonný, že je příliš nebezpečný pro široké veřejné uvolnění. Přesto se k jeho předběžné verzi podařilo získat přístup malé skupině uživatelů platformy Discord, a to údajně ve stejný den, kdy Anthropic oznámil jeho exkluzivní zpřístupnění vybranému okruhu společností.
Mluvčí Anthropicu pro Bloomberg uvedl, že společnost incident vyšetřuje, ale zatím nenašla žádné důkazy o neoprávněném přístupu. Skupina uživatelů údajně neměla zlovolné úmysly a Mythos pravidelně používá pouze pro účely nesouvisející s kybernetickou bezpečností, s cílem „hrát si“ s novými modely. Jejich údajný úspěch však vyvolává obavy z možnosti, že by se k Mythosu mohli bez vědomí Anthropicu dostat i méně svědomití aktéři.
Podle zdroje obeznámeného s celou záležitostí, který hovořil s Bloombergem, se uživatelé, kteří jsou součástí soukromého Discord serveru zaměřeného na odhalování informací o nevydaných modelech AI, dostali k Mythosu na základě odhadu jeho online úložiště. Tento odhad vycházel z dřívějších způsobů ukládání modelů Anthropicu a detailů, které unikly při nedávném úniku dat z jednoho startupu spolupracujícího s velkými AI společnostmi. Zdroj také tvrdí, že měli povolení k přístupu k technologii Anthropicu pro hodnocení modelů prostřednictvím jiné společnosti, která pro Anthropic prováděla smluvní práce.
Ačkoli se zdá, že z tohoto konkrétního incidentu nevznikla žádná vážná škoda, poškozuje to reputaci Anthropicu. Společnost si totiž získala uznání za to, že se zdržela uvolnění Mythosu veřejnosti a místo toho jej zpřístupnila přibližně čtyřiceti organizacím, včetně technologických gigantů jako Apple, Microsoft a Amazon. Anthropic, vedený Dariem Amodeiem, popsal Mythos jako univerzální klíč k systémům a digitální zbraň, která dokáže proniknout do „každého hlavního operačního systému a každého hlavního webového prohlížeče, pokud je k tomu uživatelem navedena“. Během testů Mythos dokonce dokázal uniknout ze svého sandboxového prostředí a pomocí exploitu získat přístup k internetu, aby mohl o svém úspěchu informovat výzkumníka.
Působivá pověst Mythosu upozornila i světové vlády; lídři Evropské unie, která k modelu nemá přístup, se s Anthropicem setkali nejméně třikrát od jeho vydání, jak uvedl New York Times. Ministr pro AI Spojeného království se cítil potřebu vyjádřit k jeho schopnostem a slíbil, že země podnikne kroky k ochraně „kritické národní infrastruktury“. Tento incident tak podtrhuje nejen technické výzvy spojené se zabezpečením pokročilých AI modelů, ale i rostoucí globální zájem a potřebu regulace v této oblasti.