Ironický problém AI: Placení pracovníci krmí chatboty daty, která sami vygenerovali pomocí jiné umělé inteligence
InovaceSpolečnosti vyvíjející umělou inteligenci (AI) se potýkají s nečekaným problémem: lidé, které najímají k vytváření tréninkových dat pro jejich chatboty, často používají jiné AI modely k vygenerování těchto dat.
Společnosti vyvíjející umělou inteligenci (AI) se potýkají s nečekaným problémem: lidé, které najímají k vytváření tréninkových dat pro jejich chatboty, často používají jiné AI modely k vygenerování těchto dat. Tento jev, označovaný jako „AI kanibalismus“, je podle odborníků překvapivě rozšířený a může destabilizovat velké jazykové modely (LLM).
Od roku 2010 se množství dat potřebných k tréninku AI zdvojnásobuje každých devět měsíců, což vede k postupnému vyčerpávání „čistých“, originálních dat. V reakci na to začaly firmy najímat pracovníky na nízko placené smlouvy, aby generovali nová data pro specifické úkoly, například pro správu mezd hudebníků nebo natáčení videí s běžnými domácími činnostmi. Tito pracovníci, často pod tlakem a s nízkými odměnami, se však uchylují k používání AI nástrojů, aby úkoly splnili rychleji a bez chyb.
Podle jednoho z dodavatelů, který si říká Alice, je tato praxe velmi rozšířená a firmy se ji sice snaží odhalit, ale nedaří se jim to zcela zastavit. Alice dodává, že je snadné maskovat AI-generovaná data jako vlastní, pokud se odstraní typické jazykové rysy chatbotů. Jiní dodavatelé uvádějí, že používají LLM, aby se vyhnuli chybám a neztratili práci. Jeden z nich vysvětlil, že zpočátku se bál o svůj příjem, a tak začal vše prohánět přes LLM, což se později stalo jednodušším způsobem práce.
Situace je ironická: firmy, které bez dovolení použily obsah jiných k vytvoření AI, nyní dostávají zpět „kaši“ vytvořenou stejnou technologií od svých vlastních zaměstnanců. Alice zdůrazňuje, že pokud firmy chtějí kvalitní data, měly by nabízet kvalitní smlouvy namísto toho, aby platily málo lidem v obtížné situaci a po dokončení projektů je bez varování propouštěly. Tato praxe by mohla mít výrazné dopady na celý vývoj AI, pokud se bude pokračovat v krmení modelů nekvalitními, AI-generovanými daty, což by mohlo ohrozit spolehlivost a efektivitu budoucích systémů.
Futurism