Роботів навчать складних завдань без різноманітних даних
Дослідження Нью-Йоркського університету Тандон
Як повідомляє НВ — Техно: 4 червня, 23:00 – Дослідники з Нью-Йоркського університету Тандон та Інституту робототехніки й ШІ провели дослідження, яке ставить під сумнів традиційні уявлення про навчання роботів. Вони виявили, що для навчання роботів складним завданням важливіша послідовність прикладів, а не різноманітність даних. Цей підхід дозволив створити нові методи планування рухів, які генерують послідовні навчальні приклади, що в свою чергу покращує результати навчання.
Проблеми та нові підходи
Багато сучасних роботів навчаються методом наслідування, копіюючи дії людей. Проте популярні алгоритми швидкого дослідження випадкових дерев (RRT) часто знаходять рішення, які надто сильно відрізняються одне від одного. Це ускладнює роботам визначення, яку модель поведінки слід наслідувати. Як зазначив один із дослідників, Хуайцзян Чжу:
“Такі алгоритми добре знаходять способи розв'язання задачі, але коли кожне рішення виглядає по-іншому, системі навчання важко визначити, яку модель поведінки слід наслідувати.” - Хуайцзян Чжу
Вчені запропонували нові підходи до планування рухів, які включають:
- метод, орієнтований на стабільне просування до мети;
- метод, що використовує набір заздалегідь визначених рухів для зменшення відмінностей між прикладами.
Ефективність цих підходів була перевірена на двох складних завданнях. Перше завдання включало два роботизовані маніпулятори, які мали повернути великий циліндр на 180 градусів, постійно змінюючи хват. Друге завдання полягало в тому, щоб роботизована рука перекочувала куб у долоні, щоб досягти заданого положення.
Результати дослідження вражають: у завданні з двома маніпуляторами система досягла майже ідеальної точності після навчання лише на 100 демонстраціях. Дослідники також змогли перенести отримані навички із симуляції на реальне обладнання без додаткового перенавчання. Робот із двома маніпуляторами успішно виконав 90% спроб, тоді як роботизована рука впоралася приблизно з 62% завдань. Це свідчить про значний прогрес у навчанні роботів, що може відкрити нові можливості для використання робототехніки в різних сферах.
Це дослідження має важливе значення для подальшого розвитку робототехніки, оскільки воно пропонує нові підходи, які можуть зробити процес навчання більш ефективним. Впровадження методів, що акцентують на послідовності прикладів, може змінити спосіб, яким роботи навчаються та адаптуються до складних завдань. У майбутньому це може призвести до більшої автономності роботів і їх здатності виконувати різноманітні функції в промисловості, медицині та інших сферах, де потрібна висока точність і надійність.
Ці нові методи навчання відкривають шлях до ще більш складних завдань для роботів. Наприклад, нещодавно роботизована рука з чотирма пальцями змогла навчитися грати на піаніно всього за дві хвилини, демонструючи, як швидко технології розвиваються в цій сфері. Це свідчить про потенціал нових підходів у навчанні, що дозволяють досягати вражаючих результатів за короткий час.
Читайте також

