Робототехнические исследования продвигаются вперед с разработкой роботов, способных выполнять разнообразные задачи, такие как переворачивание блинов и открытие дверей, используя подходы, вдохновленные генеративным ИИ. Вдохновленные успехами в области генеративного ИИ, исследователи начали разрабатывать более универсальных роботов, которые могут выполнять множество задач.
Последние годы показали переход от использования множества небольших моделей, каждая из которых обучена выполнять определенные задачи — распознавание изображений, создание их, создание подписей — к единым, монолитным моделям, обученным выполнять все эти задачи и многое другое. Подход, использованный в таких моделях, как GPT-4 и Google DeepMind’s Gemini, также применяется к робототехнике. Это означает, что теперь не нужно обучать отдельного робота переворачивать блины и другого открывать двери: универсальная модель может дать роботам способность к многозадачности.
Эти достижения открывают новые возможности для применения роботов в различных аспектах повседневной жизни, обеспечивая большую удобство и эффективность. В июне DeepMind выпустила обновление своего робота Robocat, который генерирует собственные данные через метод проб и ошибок, что позволяет ему обучаться выполнению разнообразных задач с минимальным вмешательством человека.