Převrat v robotice: Nové AI modely učí roboty složité úkoly až 5x rychleji a s menším tréninkem
InovaceVědci z Toyota Research Institute (TRI) dosáhli významného pokroku v oblasti robotiky, který by mohl robotům umožnit učit se nové dovednosti mnohem rychleji a s výrazně menším množstvím tréninkových dat.
Vědci z Toyota Research Institute (TRI) dosáhli významného pokroku v oblasti robotiky, který by mohl robotům umožnit učit se nové dovednosti mnohem rychleji a s výrazně menším množstvím tréninkových dat. Jejich nový výzkum ukazuje, že takzvané velké modely chování (LBMs), trénované na rozsáhlých vícesložkových datových sadách, výrazně překonávají tradiční přístupy zaměřené na jeden úkol.
Tým TRI využil téměř 1 700 hodin tréninkových dat a 1 800 reálných pokusů, aby demonstroval schopnost těchto systémů zvládat složité manipulační úkoly. Roboti s těmito modely úspěšně sestavili snídaňový tác nebo nainstalovali brzdový rotor na kolo. Podle výzkumníků tato zjištění zdůrazňují, jak může učení více úkolů urychlit nasazení přizpůsobivějších a efektivnějších robotických systémů. Jose Barreiros, výzkumník z TRI, uvedl, že jejich výsledky podporují rostoucí popularitu základních modelů robotů ve stylu LBMs a přidávají důkazy o tom, že rozsáhlý předtrénink na různorodých robotických datech je životaschopnou cestou k schopnějším robotům.
Lidstvo se posouvá k robotům pro všeobecné použití, kteří budou schopni operovat v reálném prostředí. Ačkoli jsou roboti fyzicky schopní, jejich skutečná autonomie je stále omezená. Visuomotorické učení, zejména klonování chování z lidských demonstrací, pomáhá tuto mezeru překlenout a umožňuje robotům provádět složité úkoly v náročných podmínkách bez explicitního programování. Tradiční jednoúčelové modely však často nedokážou zobecnit své znalosti mimo tréninkové scénáře, což omezuje jejich přizpůsobivost. Vědci proto stále více využívají LBMs, které jsou trénovány na rozsáhlých vícesložkových datových sadách.
V nové studii vědci trénovali několik LBMs na přibližně 1 700 hodinách robotických demonstrací, které zahrnovaly více než 500 různých úkolů. Kombinovali jak proprietární, tak veřejně dostupná data. Úkoly sahaly od základních akcí typu „vezmi a polož“ až po pokročilejší, vícestupňové činnosti, jako je krájení jablka nebo sestavení snídaňového tácu. Modely byly důkladně vyhodnoceny prostřednictvím 1 800 reálných pokusů a rozsáhlých simulací, včetně složitých, vícestupňových úkolů vyžadujících přesnost a použití nástrojů.
Výsledky studie ukázaly, že jemné doladění LBMs na specialisty pro konkrétní úkoly přináší silnější výkon než trénování modelů od základů. S použitím stejného množství dat dosahují jemně doladěné modely lepších výsledků a v mnoha případech dosahují podobných výsledků s třikrát až pětkrát menším počtem demonstrací. Tato datová efektivita je obzvláště cenná pro robotiku, kde sběr demonstračních dat pro konkrétní úkoly může být nákladný a časově náročný. Vědci zjistili, že LBMs trénované na různorodých vícesložkových datových sadách se efektivněji přizpůsobují novým úkolům a neznámým podmínkám. Jejich výkonnostní výhoda je ještě zřetelnější při změnách distribuce, kdy se reálné scénáře liší od tréninkových prostředí. Modely také vykazovaly stálé zlepšování s nárůstem předtréninkových dat, bez jasného výkonnostního plató v testovaném měřítku.