Google DeepMind官宣AI新突破:系鞋带、挂衬衫、修理“小伙伴”,机器人统统搞定了

发布时间:2024-09-13 21:23  浏览量:28

人们每天都要完成很多任务,比如系鞋带或拧紧螺丝。但对于机器人来说,学习这些高度灵巧的任务却难上加难。为了让机器人在人们的生活中发挥更大的作用,它们需要更好地在动态环境中与实物接触。刚刚,Google DeepMind 在最新博客中,介绍了他们在机器人灵巧性研究方面取得的人工智能(AI)进展:ALOHA Unleashed,帮助机器人学习执行复杂而新颖的双臂操作任务;DemoStart,利用模拟来提高多指机器人手在现实世界中的表现。通过帮助机器人学习人类的演示并将图像转化为行动,这些系统正在为机器人执行各种有用的任务铺平道路。两个机械臂,提高模仿学习能力迄今为止,大多数先进的人工智能机器人只能使用单臂拾取和放置物体,而 ALOHA Unleashed 实现了高度灵巧的双臂操作。利用这种新方法,机器人学会了系鞋带、挂衬衫、修理另一个机器人、插入齿轮,甚至还学会了打扫厨房。视频|双臂机器人拉直鞋带并打成蝴蝶结。视频|双臂机器人将一件 polo 衫放在桌子上,放到衣架上,然后挂到衣架上。视频|双臂机器人修理另一个机器人。ALOHA Unleashed 方法以 ALOHA 2 平台为基础,该平台基于斯坦福大学的原始 ALOHA(用于双臂远程操作的低成本开源硬件系统)。ALOHA 2 比以前的系统要灵巧得多,因为它有两只手,可以方便远程操作,用于训练和数据收集,而且可以让机器人通过更少的演示来学习如何执行新任务。在最新系统中,研究团队还改进了机器人硬件的人体工学设计,并强化了学习过程。首先,他们通过远程操作机器人的行为来收集演示数据,执行系鞋带和挂 T 恤等高难度任务。接下来,他们采用了一种扩散方法,从随机噪音中预测机器人的行为,这与 Imagen 模型生成图像的方式类似。这有助于机器人从数据中学习,从而能够独立完成相同的任务。从少量模拟演示中学习机器人行为控制灵巧的机器人手是一项复杂的任务,每增加一个手指、关节和传感器,这项任务就会变得更加复杂。DemoStart 使用强化学习算法帮助机器人在模拟中获得灵巧行为。这些学习到的行为对复杂的机器人(如多指手)尤其有用。DemoStart 首先从简单的状态开始学习,之后从更难的状态开始学习,直到它掌握一项任务。在模拟中学习如何解决一项任务所需的模拟演示次数,是在现实世界中学习相同任务所需的模拟演示次数的 100 倍。该机器人在多项模拟任务中的成功率超过 98%,包括调整显示特定颜色的立方体的方向、拧紧螺母和螺栓以及整理工具。在真实世界的设置中,它在立方体调整方向和提升方面的成功率为 97%,在需要手指高度协调和精确的插头插座插入任务中的成功率为 64%。视频|机械臂在模拟(左)和实际设置(右)中学习插入黄色齿轮。视频|机械臂在模拟中学习拧紧螺钉上的螺栓。研究团队使用开源物理模拟器 MuJoCo 开发了 DemoStart。在掌握了一系列模拟任务并使用标准技术(如域随机化)缩小模拟与现实之间的差距后,这一方法几乎能够以零样本(zero-shot)的方式在物理世界实现。模拟机器人学习可以减少实际物理实验所需的成本和时间。但是,设计这些模拟很困难,而且,它们并不总能成功地转化为现实世界中的表现。通过将强化学习与从一些演示中学习相结合,DemoStart 的渐进式学习能自动生成课程,弥合模拟与真实之间的差距,从而更容易地将知识从模拟转移到物理机器人中,并减少进行物理实验所需的成本和时间。为了通过深入实验来实现更先进的机器人学习,研究团队在与 Shadow Robot 合作开发的名为 DEX-EE 的三指机械手上测试了这种新方法。图|DEX-EE 的灵巧机器人手(来源:Shadow Robot)。机器人灵巧性的未来机器人是人工智能研究的一个独特领域,它展示了这一方法在现实世界中的应用效果。例如,一个大语言模型(LLMs)可以告诉你如何拧紧螺栓或系鞋带,但即使把它装入机器人体内,它自己也无法完成这些任务。总有一天,人工智能机器人将帮助人们完成家庭、工作场所等各种任务。灵巧性研究,将有助于实现这一目标。当然,要让机器人像人类一样轻松、精确地抓取和处理物体,还有很长的路要走。原文链接:https://deepmind.google/discover/blog/advances-in-robot-dexterity/翻译:学术君

外部推荐