迪士尼玩起强化学习,新机器人有星球大战那味了

西风 发自 凹非寺
量子位 | 公众号 QbitAI

迪士尼新机器人闪亮登场!

话不多说,先来看长啥样——

一闪一闪的大眼睛、摇摇晃晃的脑袋、灵活摆动的触角,还有一双小短腿。

afcd41b81c46e3a5a9295eeb675eb521.gif

走起路来屁颠屁颠,关键还很稳:

139b1f723ca29ce0cee275153fc105b6.gif

虽然是机器,但不得不说这神态很有“灵性”:

b72b631b3aa0329feb966c95044c5edf.gif

就在刚举行完的国际机器人顶会IROS上,迪士尼研究所研究科学家Moritz Bächer带领团队展示的这个新机器人,可谓萌翻全场。

970993b9b224df2824748e2e2b98875f.gif

虽然这个小家伙还没有一个正式的名字,但它的表现足够令人印象深刻。

和常见的双足机器人最大的不同点在于,它不仅能够在行走中保持动态平衡,还能够通过动作表达出一些“情感”

7ecdf84dde01aff7e703c04c9e8ba82f.gif

经研究人员介绍,这主要是因为在训练过程中使用了团队去年耗费一年时间研发的‍强化学习系统;并且还请了专业的动画师设计动作,将动画角色用动作表现情感的方式应用到了机器人身上。

基于此,小家伙不再是一个冷冰冰的机器。可以想见,若给它装一个GPT大脑,家里的狗子危~~~

af48fa2f8f3213e40d232f2059fc3a57.gif

瑞思拜,我是大学生,给我。

不少网友看到后联想到了星球大战中的角色:

47505d7ee59d259c4cfa60c186888782.png

另一波网友认为小家伙如此“憨态可掬”,分明就是现实版瓦力(WALL-E,《机器人总动员》中的角色):

ec0efbde2d20d7b0f20c5ebc517700e6.png

更有网友直呼感觉“站在了机器人革命的风口浪尖”:

ee570d194d069c11e5c57c834306eb4c.png

这个小家伙走起路来为何如此平稳?开发者具体是如何赋予其“情感”的?我们接着往下看。

在瑞士森林中“漫步”

摇头晃脑还能平稳运动的秘诀,在于头部和腿部的设计。

其中,小家伙的头部是一个四自由度的设计,可实现上、下、左、右四个方向倾斜观察:

44754334c93456e07320dd107e91faf0.gif

而它的腿部更是增加到五自由度,具备髋关节,因此它在行走时能够保持动态平衡。

偷袭推它,或是故意拖拽它脚下的地毯,它都能应对自如:

80bca30e1ec47aa5f2ebb98ca57f2997.gif
a90c9f748acbcc95b7504fb953ce2335.gif

挑战更为复杂的地形,在瑞士野外森林中漫步也不在话下:

c291d46053c09c55abe781eb346e7022.gif

稳重又不失风情,走着走着,还能跳上一段:

6ed3935ed26783e3651b2612df411ea8.gif

据研究人员介绍,能做到这种效果,从概念提出到最终打磨成型,其实只用了不到一年的时间。

这还要得益于3D打印技术,使用模块化硬件和执行器,大为提高了设计和迭代的速度。

再来说说赋予其“情感”。

其实这种让机器人以有情感的方式运动是迪士尼的专长,早在上世纪六七十年代,迪士尼就开发出了机械人偶。

但随着机器人变得愈加先进和机动,设计出能够与其兼容的情感行为变得具有挑战性。

为此,迪士尼搬出了王牌,请用了擅长使角色通过运动传达情感的动画师来为机器人设计动作。

但交由动画师设计动作,就不得不面临一个难题——

动画工具通常没有内置物理特性,动画师的设想有时在现实中难以做到。这就使得团队需要耗费大量时间试验。

为了弥合这一差距,团队用到了强化学习系统。

背后是强化学习的加持

研究团队开发了一个基于强化学习的流程,通过模拟将动画师的视觉设想和机器人动作相结合。

cb3bf7ea42f9d1c309c18eb9b59e38fd.gif

这个过程本质上是为动画师提供了物理约束条件,确保动画师设计的高表现力动作可以在现实中实行,或者尽可能接近机器人所能做到的程度。

迪士尼研究所的研究科学家Morgan Pope表示:

这就不仅仅是走路了,走路只是强化学习系统的输入之一,另一个重要的输入是如何行走。

好在这种情况下,强化学习的一大优势是生成的运动鲁棒性很好。

并且根据研究人员的说法,用该流程在一台PC上只需几个小时就能训练机器人做新动作,大大缩短了开发新机器人角色所需的时间。

同时在一遍遍的训练中,还可以对电机性能、质量分布和机器人与地面之间的摩擦力等进行细微的调整。

团队负责人Bächer认为,“这使得迪士尼开发新机器人角色所需的时间从几年缩短到几个月”。

并且研究人员还强调重要的不是机器人,而是这个过程:

所以如果我们想要增加更多的腿、手臂,或者制作一个全新角色,我们可以迅速教它新的动作。现成的执行器、3D打印组件、可适应性强的强化学习框架,这些都可以应用于外观和动作都大不相同的机器人。

而这个机器人,只是该旅程的第一步。

参考链接:
[1]https://twitter.com/linusekenstam/status/1710277661069574171
[2]https://spectrum.ieee.org/disney-robot

「量子位2023人工智能年度评选」开始啦!

今年,量子位2023人工智能年度评选从企业、人物、产品/解决方案三大维度设立了5类奖项!欢迎扫码报名 

MEET 2024大会已启动!点此了解详情

8a43aad5033bbc9de4d2cc789980b3ce.png

点这里👇关注我,记得标星哦~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值