机器人成了我的遛弯搭子!室外复杂地形难不住,还能上“健身房”跑两步

西风 一水 发自 凹非寺
量子位 | 公众号 QbitAI

别光只看Figure 02了,国产机器人最新成果曝光,大秀肌肉!

就在北京亦庄,竟有这么一家人形机器人“健身房”。

这里的机器人率先实现在跑步机上训练,一小时能跑6km的那种:

0c79ba52879ee892dc9f05621df8bd66.gif

而这只是热身,跑完还要爬楼梯:

07bf1ae2db88d30ae2e00efa53b69c77.gif

到了室外,机器人专用道也安排上了,30度高温下不能停:

6f22acd0357a4dd7a6908879511281e4.gif

时不时还要来点草坪、斜坡等复杂地形上难度:

cf032aaa11d37a4fef5b3f3a03bb11e1.gif

它就是今年四月份在国内首发的纯电驱全尺寸人形机器人天工,由京具身智能机器人创新中研发。

刚问世那会儿,天工主打的还是拟人奔跑,短短几个月,本事又长了不少。

除了上面所展示的在跑步机上奔跑、户外复杂地形行走,天工现在还加持了大模型,可中英文对话,还能听从人类指令抓取物品。

最近,2024世界机器人大会就要举办了,量子位提前打听到,整合“不只”这些能力,进化版“天工”将在大会上亮相。

而且到时候天工会换“马甲”,装上手,还会升级大关节

关于进化版天工的能力,我们和其运动控制负责人郭宜劼聊了聊。

全身42个自由度,大模型加持

升级后的天工功能参数一览如下:

a6d8f639456e8ab1d1dc212e08757709.png

和之前相比如下表,身高163cm,体重由原来的43kg增加到了56kg。

全身自由度增加到了42个,相比之前单只手臂自由度由3个增加到7个,颈部也增加了3个自由度。

72e47244f1e19a03212a41c9774f2547.png

ff811bc6e8ed4ce56b836b7acafae997.png
初代天工功能参数

此前天工“没有手”,这次也装上了。单只手重达600g,具有6个自由度,触觉传感器精度在0.3N以内,单指的抓握力大于1kg。

而且天工还配备了四个全场景双目结构光3D相机、高精度六维力传感器,可实现360度环境感知。

通过对环境的感知,天工能适应复杂地形,在草地、沙地、丘陵、碎石里移动,应对30cm的地形差也不是问题。

奔跑起来稳定性也提升了,速度可达6km/h。

除此外,天工的另一大升级是搭载了大模型,具备了多模态操作能力

069c519e34b4641ecb7a09f29804dd4a.gif

现在能开口说话和人类交互,支持中英文。

还能听从人类指令抓取物品:

而这些只是其中的一部分,世界机器人大会上还会有更多展示和惊喜。

天工首秀那会儿,主打拟人奔跑单项能力。从目前的进化版来看,结合了感知交互,可以说,天工已经初步形成了具身智能体形态。

研究具身智能规划决策和任务执行,也正是天工背后团队目前的关注重点。

打造具身智能体

以具身智能为基础,目前在技术实现上,研究团队重点提升了天工的视觉感知能力

之前天工行走是“盲视”状态,需要用脚掌对地面进行试探,而现在基于视觉感知,面对较大地形差,天工可以通过提前预测做出抬高腿等动作来应对。

d3c5b159d3e43c5f94ffd6ec36a1cfc6.gif

具体方法上,团队基于强化学习,自研了运动技能学习方法——基于状态记忆的预测型强化模仿学习

此前量子位也有介绍,该方法融合了传统方法平稳性高的优点,以及强化学习泛化性强、不依赖环境的优点。

既解决了强化学习带来的定位精度差的问题,又解决了模型预测控制方法当中对于非结构化环境适应性差的问题。

天工运动控制负责人郭宜劼也向量子位透露,之前团队在训练时发现,一些网络在实际运行过程中可能会很容易受传感器漂移的干扰,有时会表现出姿态的不稳定等情况,由此提出了这种方法。

初代天工发布后,团队在接下来的几个月的训练中,为天工加入了更多的历史状态记忆,使其能够对当前的自身状态和环境地形进行估计,从而有更好的泛化效果。

a457d8815ce95b40adf766029ebcb2dc.gif

郭宜劼还表示,目前具身智能要解决的是“Action”任务规划执行这方面的问题。

无论从任务种类还是复杂度上来说,让它能够覆盖人类日常工作生活中大部分的任务。它能干的活种类变多,大脑再去配合起来就能够实现更复杂、更长线的任务。

6f0b98ce95e0d39041044ed11e1ce7eb.gif

‍对于实现复杂任务规划,他分享了几条技术路线:

像是特斯拉机器人,主要采用的是收集数据,然后用数据进行监督学习,针对比较单一固定的场景训练机器人自动执行。这种方法虽收效比较快,但泛化能力差一些。

还有一种是在仿真环境中进行强化学习训练,主要依赖的是在一个环境中进行不断地试错,自我学习。这种方法遇到的主要问题是,怎样从仿真环境迁移到真实的物理场景中。从感知层面到和具体的物理交互,仿真和真实场景都有很大的差别。

另外一种方法是直接用大模型输出一些任务点,然后用传统的运动规划去执行这些任务。

而天工研发团队的方案是将不同的方法融合,下一步要打造出一个元技能库

现在这个阶段我觉得是要扩大机器人的技能库……包括这几种方法在内,每一种方法都可以用来解决不同的任务场景。所以说技能库里每种技能可能是使用不同的方式来实现的。

解决国内机器人“共性”问题

再来说说天工背后公司,量子位此前也有介绍过。

北京具身智能机器人创新中心(下称创新中心),原名北京人形机器人创新中心,去年11月成立,由小米机器人、优必选、京城机电、亦庄机器人等联合组建。

c5ee6292d5dd867cde908150f15fe566.png

他们瞄准的是解决具身智能机器人的关键共性问题,避免国内机器人行业重复简单造轮子的过程。

创新中心聚集了一批顶尖科学家和工程师,还牵头成立了创新中心专家委员会和北京人形机器人产业联盟。

创新中心专家委员会由中国科学院院士乔红担任主任,通用研究院院长朱松纯、智源研究院理事长黄铁军、信通院总工程师魏然担任副主任。

今年四月份,创新中心推出了“天工”通用机器人母平,即具身智能硬件开源平台。

“天工”平台可实现灵活扩展软、硬件等功能模块,提供了一系列开放接口,科研机构及机器人相关企业可基于“天工”母平台软硬件功能进行二次开发。

当时他们就预告了将着眼于依靠大模型驱动,探索通用具身智能平台。而现在多能具身智能体母平台“开物”,也逐渐浮出水面,正紧锣密鼓研发中。

“开物”平台着眼于具身智能大模型及框架,聚焦多模态的关键法、具身智能仿真应用建设及工具链整套体系建设。

围绕“开物”,团队正在打造大规模具身智能数据集,用来支撑超70亿参数视觉语言多模态大模型训练调优,实现机器人中文互动、开放问答、场景视觉理解、具身操作等能力。

计划是,在2025年底前发布200万条高质量数据

ea1144c49c8252ce900084e42360cb33.png

话说回来,最近人形机器人领域有不少新进展传出。

优必选透露人形机器人已在极氪工厂打工;特斯拉官图显示Optimus已进厂挑拣电池;OpenAI加持的机器人Figure 02,进驻宝马打工……

虽然“天工”和它们不是一个赛道,主要是解决具身智能的共性问题,但……也没能逃过搬砖的命运。

据了解,它正初步在一些场景中进行数据采集试训,比如重复性比较高、枯燥乏味的搬运分拣物品,在危险场景如矿井、工地进行巡检、搜救……

74998a80daa82cece7a20e2fb2cbb3de.png

2024世界机器人大会马上将于8月21日在北京经济技术开发区开幕,期待进化版“天工”的家人们可以码住了,听说创新中心会有一个精彩的展位,可以看到“天工”机器人家族的集体亮相,还会办一个分论坛~

One More Thing

为啥要让机器人在跑步机上跑?大伙儿猜猜看(doge)。

17025f2a66aa4d720f8b40c5ae452b81.gif

答:除了对平衡性要求更高外,跑步机速度可控,能够比较准确客观测试;机器人跑步实验需要占用比‍较大的场地,跑步机省地方啊。

量子位年度AI主题策划正在征集中!

欢迎投稿专题 一千零一个AI应365行AI落地方案

或与我们分享你在寻找的AI产品,或发现的AI新动向

ad2ba6df182a7814714251b138e8e423.png

点这里👇关注我,记得标星哦~

  • 3
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值