Исследователи из Нью-Йоркского университета Тандон пересматривают подходы к обучению роботов
4 июня, 23:00 – Ученые из Нью-Йоркского университета Тандон и Института робототехники и ИИ представили работу, которая бросает вызов устоявшимся представлениям о тренировке роботизированных систем. Вместо того чтобы полагаться на разнообразие данных, они выяснили: ключевую роль играет последовательность демонстраций. Разработанные на этой основе методы планирования движений генерируют цепочки обучающих примеров, что заметно повышает эффективность обучения.
Смена парадигмы: от хаоса к порядку
Большинство современных роботов осваивают навыки через имитацию, повторяя действия человека. Однако популярные алгоритмы быстрого поиска случайных деревьев (RRT) нередко выдают слишком разные варианты решений. Это сбивает систему с толку: она не понимает, какую модель поведения копировать. Как пояснил исследователь Хуайцзян Чжу:
“Подобные алгоритмы отлично находят способы решения задач, но когда каждое решение выглядит по-новому, обучающей системе трудно выделить эталон для подражания.” — Хуайцзян Чжу
Авторы работы предложили два новых подхода к планированию движений:
- метод, ориентированный на стабильное продвижение к цели;
- метод, использующий заранее заданные наборы движений для минимизации различий между примерами.
Эти стратегии проверили на двух сложных сценариях. В первом два роботизированных манипулятора должны были перевернуть крупный цилиндр на 180 градусов, постоянно меняя хватку. Во втором — роботизированная рука перекатывала куб в ладони, чтобы достичь нужного положения.
Результаты впечатляют: в задаче с двумя манипуляторами система достигла почти идеальной точности после всего 100 демонстраций. При этом навыки, полученные в симуляции, удалось перенести на реальное оборудование без дополнительного обучения. На практике робот с двумя манипуляторами успешно справился с 90% попыток, а роботизированная рука — примерно с 62% задач. Это демонстрирует серьезный прогресс в области обучения роботов и открывает новые горизонты для их применения.
Данное исследование особенно актуально для российских разработчиков, которые часто сталкиваются с ограниченностью данных в промышленной робототехнике. Внедрение методов, делающих упор на последовательность примеров, способно кардинально изменить то, как роботы учатся и адаптируются к сложным операциям. В перспективе это может привести к созданию более автономных систем, способных выполнять широкий спектр задач в промышленности, медицине и других сферах, где критически важны точность и надежность.
В то время как исследователи из Нью-Йоркского университета Тандон разрабатывают новые подходы к обучению роботов, другой проект демонстрирует, как современные технологии могут достигать впечатляющих результатов за короткое время. Например, недавно роботизированная кисть с четырьмя пальцами освоила игру на фортепиано всего за 120 секунд, что подчеркивает потенциал быстрого обучения в робототехнике.