花最少的钱,训超6的机器人:谷歌大脑推出机器人强化学习平台,硬件代码全开源...

鱼羊 发自 凹非寺
量子位 报道 | 公众号 QbitAI

想要在现实世界的机器人身上探索强化学习(RL),并非易事。

首先,你得拥有类似这样的机器人平台:

640?wx_fmt=gif

而像这样的一只PR2,售价高达40万美元(约合人民币286万元)

这就足以让很多刚刚起步,或者正想涉足RL/机器人学研究的小型实验室望而却步了。

不过现在,谷歌正在试图让这件事变得更简单,更便宜

比如这样一只三指机器人:

640?wx_fmt=gif

价格仅3500美元(约合人民币2.5万元)。

还有这样一只四足机器人:

640?wx_fmt=gif

价格4200美元(约合人民币3万元)。

并且,还有相应的开源代码,和精心设计的基准测试作为配套。

这就是谷歌的ROBEL基准。这项研究登上了CoRL 2019。

ROBEL

ROBEL由两只机器人组成,适用于不同的强化学习研究任务。

三指手形机器人,名为D’Claw,擅长学习灵巧操作任务。

640?wx_fmt=gif

D’Claw执行任务的过程中有三种常见的操纵行为。

姿势,适应不同环境的形状。

640?wx_fmt=png

旋转,将物体旋转到指定的角度。

640?wx_fmt=png

以及拧紧。

640?wx_fmt=png

四足机器人,名叫D’Kitty,是只小猫咪,擅长学习敏捷移动。

640?wx_fmt=gif

它的三种基准测试动作,是站立,定向和行走。

640?wx_fmt=png

机器人的设计都基于现成的组件和常用的原型制作工具(3D打印或激光切割),模块化,易于组装,易于维护。

即使你对硬件并不在行,也仅需要几个小时的时间,就能构建完成。

ROBEL还为所有这些基准测试任务提供了模拟器,有助于研究人员进行算法开发和快速原型设计。

640?wx_fmt=png

可复现,很鲁棒

听上去便宜好用的ROBEL,到底靠不靠谱呢?

迄今为止,谷歌已经对其进行了长达14000多个小时的训练。

实验证明,ROBEL能够胜任多种机器学习算法。

640?wx_fmt=png

并且,两个不同的实验室分别对ROBEL进行了“试用”。仅使用ROBEL的设计文件和装配说明,两个实验室都成功复现了ROBEL的两个硬件平台。

两个实验室都对自己组装起来的ROBEL进行了基准任务测试。

640?wx_fmt=png

两条训练曲线几乎重合。也就是说,在不同地点建造的两只机器人,不仅表现出了相似的训练进度,并且最终都收敛到了同一性能水准。

还真是便宜又好货啊。

传送门

博客地址:

ROBEL项目地址:

论文地址:

作者系网易新闻·网易号“各有态度”签约作者

大会启幕!预见智能科技新未来

量子位MEET 2020智能未来大会启幕,将携手优秀AI企业、杰出科研人员呈现一场高质量行业盛会!详情可点击图片:

榜单征集!三大奖项,锁定AI Top玩家

2019中国人工智能年度评选启幕,将评选领航企业、商业突破人物、最具创新力产品3大奖项,并于MEET 2020大会揭榜,欢迎优秀的AI公司扫码报名!

640?wx_fmt=jpeg
640?wx_fmt=jpeg

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「好看」吧 ! 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值