AI chatboty uvízly v „myšlení davu“: Startup z Austrálie učí jazykové modely kreativitě
InovaceZkuste si jednoduchý test: požádejte svého oblíbeného chatbota (ChatGPT, Claude, Gemini), aby vám vygeneroval náhodné číslo mezi 1 a 10. S velkou pravděpodobností dostanete číslo 7. Pokud požádáte znovu, pravděpodobně se objeví 3 nebo 4, a poté 8 nebo 9.
Zkuste si jednoduchý test: požádejte svého oblíbeného chatbota (ChatGPT, Claude, Gemini), aby vám vygeneroval náhodné číslo mezi 1 a 10. S velkou pravděpodobností dostanete číslo 7. Pokud požádáte znovu, pravděpodobně se objeví 3 nebo 4, a poté 8 nebo 9. Tento jev není náhodný, ale odhaluje překvapivou předvídatelnost a nedostatek kreativity u většiny velkých jazykových modelů (LLM). Zatímco pro úkoly jako kódování nebo výzkum to nemusí být problém, při brainstormingu nebo plánování dovolené se takové „skupinové myšlení“ stává značnou překážkou.
Australský startup Springboards přichází s řešením. Vyvinul vlastní LLM s názvem Flint, který byl trénován tak, aby na otevřené otázky, jako je „Kam bych měl jet v Evropě?“, nabízel mnohem širší škálu odpovědí než běžné modely. Pip Bingemann, spoluzakladatel a CEO Springboards, uvádí, že zatímco většina jazykových modelů bojuje s halucinacemi, oni je vítají. Při testování Flint dokázal vygenerovat odlišné náhodné číslo (např. 3.7916 místo 7) a navrhnout méně obvyklé typy aut (Ford F-150 místo Toyoty či Hondy) nebo originálnější reklamní slogany (Flint: „Built to last, run to win“ vs. Claude/ChatGPT: „Run your way“).
Tato zvláštní omezení LLM si získávají stále větší pozornost. V listopadu tým výzkumníků publikoval studii nazvanou „Artificial Hivemind: The Open-Ended Homogeneity of Language Models (and Beyond)“, která odhalila pozoruhodnou míru opakování nejen v odpovědích jednotlivých LLM, ale i mezi nimi. Zjistili, že různé modely se shodují na velmi podobných odpovědích, když jsou vyzvány k otevřeným otázkám. Výzkumníci spekulují, že je to způsobeno tím, že většina dnešních LLM je trénována podobnými způsoby na podobných datech pro podobné úkoly. Například, když bylo 25 různým LLM padesátkrát položeno, aby napsaly metaforu o čase, většina z 1 250 odpovědí byla variací na „Čas je řeka“ nebo „Čas je tkadlec“.
Kieran Browne, spoluzakladatel a CTO Springboards, poznamenává, že lidé si často neuvědomují, do jaké míry dostávají stejné informace jako všichni ostatní. Příkladem jsou návrhy názvů kapel, kde modely často zmiňují slova jako „sklo“, „neon“, „samet“ nebo „statika“. OpenAI k tomu uvádí, že trénování modelů k poskytování spolehlivých a koherentních odpovědí je může vést ke konvergenci kolem známých, vysoce pravděpodobných reakcí, a že snaha o větší originalitu může vést ke slabším nebo méně spolehlivým výsledkům.
Springboards vyvinul nástroj, který využívá výběr LLM, včetně ChatGPT a Claude, a je určen pro kreativní profesionály v reklamě nebo marketingu k brainstormingu nápadů. Flint je v tomto nástroji nabízen jako alternativní model pro uživatele hledající větší rozmanitost. Zoe Scaman, zakladatelka startupu Bodacious, ocenila Flint za jeho schopnost „katapultovat ji do zcela jiných směrů“. V jednom testu, kde modely měly navrhnout, jak by se dala redefinovat finanční společnost pro dnešní mládež, mainstreamové modely navrhovaly „zábavnou finanční gramotnost“, zatímco Flint přišel s myšlenkou rebrandingu celého konceptu akumulace bohatství. Ačkoliv je Flint stále prototyp a občas selže, jeho základní myšlenka je velmi silná.