Roboti se učí zotavit z pádů na schodech: AI systém s ramenem zastaví nebezpečný pád v průměru za 4 sekundy
InovaceServisní roboti určení pro navigaci po schodištích se stále potýkají s významným bezpečnostním problémem. Ztráta rovnováhy často vede k pádům, které se rychle zrychlují a hrozí poškozením samotného robota i jeho okolí.
Servisní roboti určení pro navigaci po schodištích se stále potýkají s významným bezpečnostním problémem. Ztráta rovnováhy často vede k pádům, které se rychle zrychlují a hrozí poškozením samotného robota i jeho okolí. Podle víceleté terénní studie, na kterou se odvolává tým výzkumníků, selhávají roboti navržení pro schody nejméně 35krát častěji na schodištích než na rovném terénu. Tradiční bezpečnostní systémy se zaměřují především na prevenci pádů pomocí navigačních algoritmů a detekce překážek, ale tyto metody nedokážou plně eliminovat riziko v reálném prostředí, kde může nečekaná interakce, například srážka s člověkem, vyvolat pád.
Tuto mezeru se snaží řešit nový systém vyvinutý výzkumníky z laboratoře Robotics and Automation Research (ROAR) na Singapurské univerzitě technologie a designu (SUTD). Místo pouhé prevence pádů se systém založený na posilovacím učení (reinforcement learning) aktivně snaží stabilizovat robota během pádu. Tým nejprve analyzoval, jak k pádům na schodech dochází v reálných podmínkách, a identifikoval pět primárních typů pádů. Na základě této analýzy navrhli tříkloubové robotické rameno, které je schopné čelit všem pěti typům pohybu, když je namontováno na zadní části pásové mobilní platformy.
Řídicí systém byl trénován výhradně v simulaci pomocí posilovacího učení. Během každé tréninkové epizody byl robot vystaven simulovaným vnějším silám, které ho tlačily k pádu. Kontrolér se pak v reálném čase učil, jak upravovat klouby ramene, aby platformu stabilizoval. Systém dosáhl průměrné úspěšnosti 69,4 procenta při zastavení pádů a obnovení stability, zatímco tradiční ručně kódovaná metoda dosáhla pouze 38,6 procenta. Když byl systém úspěšný, stabilizoval robota v průměru za 4,25 sekundy, což splnilo interní cíl týmu pod 10 sekund.
Výzkumníci také ověřili, zda systém funguje i mimo přesný typ robota, na kterém byl trénován. Hodnotili ho na platformách, které byly o 10 procent větší nebo menší, a na schodištích s různými rozměry. V některých případech se výkon dokonce zlepšil, přičemž nejlepší kontrolér dosáhl 87procentní úspěšnosti na větším robotovi. To naznačuje, že kontrolér se učí obecnou strategii zotavení, nikoli jen memoruje jednu konkrétní geometrii. Ačkoli systém ještě není připraven k plnému nasazení, protože nesplňuje přísné průmyslové bezpečnostní normy, tým pracuje na zlepšení spolehlivosti, přidání mechanických pojistek a vývoji vysvětlitelných modelů pro certifikaci. Tato práce je součástí širšího úsilí SUTD o zvýšení bezpečnosti autonomních mobilních robotů v reálném prostředí.
Interesting Engineering