Překvapivý objev: Roboti se učí složité úkoly lépe z předvídatelných dat než z rozmanitých
InovaceVědci z Newyorské univerzity Tandon School of Engineering a Robotics and AI Institute přišli s průlomovým zjištěním, které zpochybňuje dosavadní přesvědčení, že pro učení robotů je vždy nejlepší co nejrozmanitější tréninková data.
Vědci z Newyorské univerzity Tandon School of Engineering a Robotics and AI Institute přišli s průlomovým zjištěním, které zpochybňuje dosavadní přesvědčení, že pro učení robotů je vždy nejlepší co nejrozmanitější tréninková data. Jejich studie ukazuje, že roboti trénovaní na strukturovaných a předvídatelných ukázkách dosahují výrazně lepších výsledků než ti, kteří se učí z vysoce variabilních příkladů.
Učení robotů manipulaci s předměty s lidskou obratností představuje jednu z největších výzev v robotice. Systémy pro učení nápodobou, kde se stroje učí kopírováním lidských demonstrací, často narážejí na problém s detailním zachycením jemných pohybů prstů a komplexních interakcí. Aby tento nedostatek překonali, výzkumníci se obrátili k algoritmům pro plánování pohybu, které automaticky generují ukázky ve fyzikálních simulacích.
Tým však brzy narazil na problém: populární metody plánování, známé jako RRT (rapidly exploring random trees), vytvářely řešení, která se od jedné demonstrace k druhé příliš lišila. Tato „data s vysokou entropií“ sice pomáhají algoritmům prozkoumávat různá řešení, ale snižují efektivitu učení nápodobou, protože roboty mají potíže identifikovat chování, které mají napodobit. „Když každé řešení vypadá jinak, systém učení se snaží přijít na to, jaké chování by měl napodobit,“ vysvětlil hlavní autor Huaijiang Zhu.
Pro řešení tohoto problému vyvinul tým alternativní přístupy k plánování, které generují konzistentnější ukázky. Jedna metoda upřednostňovala stabilní pokrok k cíli, zatímco druhá využívala knihovnu předdefinovaných pohybů ke snížení variability mezi příklady. Roboti trénovaní na těchto konzistentnějších demonstracích dosáhli podstatně vyšší úspěšnosti. V úloze s dvěma robotickými rameny, která měla otočit velký válec o 180 stupňů a opakovaně upravovat úchop, systém dosáhl téměř dokonalého výkonu s pouhými 100 ukázkami. Naučené postupy byly také úspěšně přeneseny ze simulace přímo na fyzický hardware, kde robotická ramena uspěla v 90 % reálných pokusů a robotická ruka dokončila asi 62 % svých pokusů.
Tato zjištění podtrhují rostoucí trend v robotice, který kombinuje tradiční plánování pohybu s strojovým učením. Namísto odděleného přístupu se stále častěji využívají plánovací algoritmy k generování tréninkových dat pro učící se systémy. Studie rovněž posiluje širší poznatek v oblasti umělé inteligence: větší množství dat ne vždy vede k lepšímu učení. V některých případech mohou být pečlivě strukturované příklady cennější než velké sbírky hlučných nebo nekonzistentních demonstrací, což otevírá nové možnosti pro efektivnější vývoj robotických systémů.
Interesting Engineering