人形机器人通过人类视频模仿操控任务

人形机器人通过人类视频模仿操控任务

原创 geek369 极客开源 2024年10月28日 09:23 北京

图片

人形机器人领域有一个价值百万美元问题,就是如何利用互联网上已有的视频进行训练,OKAMI 就一个能使人形机器人通过单一人类视频模仿操控任务的项目。

图片

OKAMI 算法单个RGB-D视频生成参考计划,并推导出遵循该计划完成任务的策略,OKAMI 包括了两阶段方法,使人形机器人能够从单个人类视频中模仿操作任务。

图片

第一阶段帮助人形机器人理解无动作视频中发生的事情:

  • 使用VLM识别任务相关物体

  • 跟踪整个视频中的物体运动

  • 使用人体重建模型获取SMPL-H轨迹

  • 基于物体关键点速度识别子目标

  • 将所有信息整合形成参考计划

图片

第二阶段通过物体感知重定向合成人形机器人动作:

  • 定位任务相关物体并检索子目标

  • 使用逆运动学和精确重定向将SMPL-H轨迹重定向到人形机器人

  • 根据测试时物体位置调整轨迹

  • 将轨迹发送到真实机器人执行

图片

OKAMI 为在日常环境中部署人形机器人提供了新思路,使人形机器人能够通过单个人类视频快速适应新任务。我们的实验表明,OKAMI 比基准方法的性能提高了 58.33%,同时展示了在不同视觉和空间条件下的系统性泛化能力。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值