Jazyková bariéra AI: Proč umělá inteligence nerozumí naléhavým zprávám o klimatických událostech a co to znamená pro pomoc
InovaceUmělá inteligence (AI) se stává stále důležitějším nástrojem v mnoha oblastech, včetně reakcí na klimatické události. Ukazuje se však, že její schopnost efektivně pomáhat je omezena jazykovými a kulturními bariérami.
Umělá inteligence (AI) se stává stále důležitějším nástrojem v mnoha oblastech, včetně reakcí na klimatické události. Ukazuje se však, že její schopnost efektivně pomáhat je omezena jazykovými a kulturními bariérami. AI systémy, trénované převážně na západních textech, často nedokážou správně interpretovat naléhavé zprávy z jiných částí světa, kde se používá slang nebo pidgin angličtina.
Příkladem může být rozdíl v komunikaci mezi Spojeným královstvím a Nigérií. Zatímco britský příspěvek na sociálních sítích, vyjadřující frustraci z povodní, může AI snadno rozpoznat sarkasmus a nespokojenost s místními úřady, zprávy z Nigérie znějí pro AI jinak. Věty jako „Abeg is it October wey rain dey fall like this, but you say the climate no change?“ nebo „River don near our house o! Abeg help, e fit spoil everything!“ vyjadřují okamžité nebezpečí a naléhavou žádost o pomoc. Nicméně AI modely tyto zprávy často snižují na běžný komentář, čímž zcela míjejí naléhavost a emoce, které jsou sdělovány.
Tento problém pramení z toho, že většina AI systémů je trénována na obrovském množství textů zaměřených na západní kulturu, převážně ze Severní Ameriky a Evropy. Například ChatGPT se učí z rozsáhlých internetových textů a generuje odpovědi na základě vzorců, které viděl online. AI tak odráží převažující kulturu ve svých trénovacích datech a nese „kulturní otisk“. Modely trénované převážně na anglických textech vykazují skryté zkreslení, které upřednostňuje západní kulturní hodnoty, zejména při dotazech v angličtině.
Jedním z hlavních důvodů, proč AI může produkovat zkreslené výsledky, je to, že odráží společenské nerovnosti, včetně rozdílů v rase, pohlaví a regionu, které se objevují v datech, z nichž se učí. Nedostatečně zastoupené hlasy z komunit v rozvojových zemích, které používají neanglocentrické varianty angličtiny, jsou tak často oslabeny nebo ignorovány. Toto zkreslení může mít skutečné důsledky. V klimatických událostech, jako jsou záplavy, vlny veder nebo jiné extrémní počasí, mohou špatně interpretované zprávy ohrozit majetek a životy. AI systémy, které se spoléhají na minulé vzorce, jsou snadno interpretovatelné, když jazyk odpovídá očekávaným standardům, ale příspěvky, které se neshodují s přítomností místního slangu nebo signálů naléhavosti, mohou být špatně interpretovány, což brání včasné a efektivní pomoci.
The Conversation