Meta AI Muse Spark: Nový model rozumí textu i obrazu a spotřebuje 10x méně výpočetního výkonu
InovaceSpolečnost Meta představila Muse Spark, nový model umělé inteligence, který signalizuje změnu v její strategii vývoje AI. Jedná se o první produkt z laboratoří Meta Superintelligence Labs, který kombinuje multimodální uvažování s prováděním úkolů ve stylu agentů.
Společnost Meta představila Muse Spark, nový model umělé inteligence, který signalizuje změnu v její strategii vývoje AI. Jedná se o první produkt z laboratoří Meta Superintelligence Labs, který kombinuje multimodální uvažování s prováděním úkolů ve stylu agentů. Jeho uvedení na trh přichází v době, kdy se velké technologické firmy snaží definovat další fázi AI, která přesahuje pouhé chatboty. Na rozdíl od dřívějších modelů zpracovává Muse Spark text, obrázky a nástroje v jediném rámci a zavádí systém, kde může současně pracovat více uvažujících agentů. Meta uvádí, že toto nastavení zlepšuje výkon při řešení složitých problémů, ačkoli společnost uznává, že stále existují určité nedostatky.
Muse Spark odráží širší posun v odvětví směrem k systémům, které dokážou interpretovat a jednat na základě vizuálních dat a dat z reálného světa. Model umí analyzovat obrázky, řešit vizuální vědecké a technické problémy a identifikovat objekty s kontextuálním porozuměním. Podporuje také krok za krokem uvažování nad vizuálními vstupy, což Meta popisuje jako „vizuální řetězec myšlenek“. Tyto schopnosti umožňují praktičtější využití. Uživatelé mohou systém požádat o řešení problémů s domácími spotřebiči nebo je provést úkoly pomocí anotovaných vizuálů. Model dokáže také generovat interaktivní obsah, včetně jednoduchých her vytvořených z uživatelských pokynů.
Klíčovým doplňkem je takzvaný „režim přemýšlení“ (Contemplating mode), který spouští více uvažujících agentů paralelně s cílem efektivněji řešit náročnější úkoly. Tento přístup odráží snahy konkurentů škálovat uvažování prostřednictvím zvýšeného výpočetního výkonu v době odvozování. Za uvedením modelu stojí také rozsáhlá změna infrastruktury. Meta uvádí, že během posledních devíti měsíců přestavěla svůj tréninkový proces se zaměřením na návrh modelu, optimalizaci a kuraci dat. Společnost tvrdí, že tyto změny umožňují Muse Spark dosáhnout srovnatelných úrovní výkonu s desetinásobně menším výpočetním výkonem než její předchozí model Llama 4 Maverick. Pokud se tato efektivita potvrdí, mohla by výrazně snížit náklady na vývoj větších AI systémů.
Posilující učení zůstává ústředním prvkem přístupu. Meta hlásí stabilní pokroky při škálování tréninku, s vylepšeními pozorovanými jak při tréninku, tak při vyhodnocovacích úkolech. Společnost tvrdí, že to ukazuje předvídatelnější pokrok než dřívější metody, které často zápasily s nestabilitou. Meta prezentuje Muse Spark jako první krok k tomu, co nazývá „osobní superinteligencí“. Tato myšlenka se soustředí na systémy AI, které rozumí prostředí uživatelů a poskytují jim přizpůsobenou pomoc. Zdravotnictví je jednou z prvních oblastí zájmu, přičemž tréninková data byla vyvíjena ve spolupráci s lékaři za účelem zlepšení lékařských vysvětlení. Muse Spark je nyní k dispozici prostřednictvím platforem AI společnosti Meta, s omezeným přístupem API pro vývojáře. Toto vydání podtrhuje, jak se mění konkurence v oblasti AI. Společnosti již nestaví jen chytřejší modely, ale systémy navržené pro fungování v reálném světě, i když otázky spolehlivosti a ověřování zůstávají otevřené.