首次突破:蒙面仿人控制器实现全身运动的多模态追踪与现实世界控制

更多优质内容,请关注公众号:智驾机器人技术前线

1.论文信息

  • 论文标题:Learning Multi-Modal Whole-Body Control for Real-World Humanoid Robots

  • 作者:Pranay Dugar, Aayam Shrestha, Fangzhou Yu, Bart van Marum, Alan Fern

  • 作者单位:俄勒冈州立大学协作机器人与智能系统(CoRIS)研究所

  • 论文地址:https://arxiv.org/abs/2408.07295

  • 项目主页地址:https://masked-humanoid.github.io/mhc/

2.摘要

本文介绍了蒙面仿人控制器(Masked Humanoid Controller, MHC),用于跟踪任意仿人状态变量子集的目标轨迹的全身运动。这使得能够实现来自多样化来源的全身运动,例如视频、动作捕捉和虚拟现实,同时确保平衡和对干扰的鲁棒性。MHC在模拟环境中接受训练,使用精心设计的教学大纲模仿来自行为库的部分遮蔽动作,这些行为包括预训练策略的展开、优化的参考轨迹、重新定位的视频剪辑和人类动作捕捉数据。我们展示了模拟实验,验证了MHC执行各种行为的能力,这些行为来自部分指定的目标运动。此外,我们还强调了从模拟到现实的转移,这通过在Digit仿人机器人上进行的现实世界试验得到了证明。据我们所知,这是第一次学习控制器能够实现现实世界仿人机器人的全身控制,以应对如此多样化的多模态目标。

3.主要贡献

  • 创新的全身体控制器设计: 文章提出了Masked Humanoid Controller (MHC),这是一个能够适应多种输入模态(视频、动作捕捉、虚拟现实)并执行全身运动的控制器。MHC的设计重点在于实现平衡性、鲁棒性以及在面对动态变化和外部干扰时的适应性,同时具备易于扩展和最小化重训练需求的特点,显著提升了人形机器人在复杂环境中的多用途运动能力。

  • 模拟到现实世界的转移: 通过在模拟环境中对MHC进行基于课程的训练,结合精心设计的动态随机化策略,文章成功地将模拟中学习到的控制策略转移到了真实世界的Digit人形机器人上。这一转移不仅证明了MHC在多样化行为(如行走、拳击、物体拾取)中的稳健性,而且突显了其在面对现实世界复杂性时的泛化能力。

  • 先进的训练和评估方法: 文章采用了分阶段的课程设计,逐步引导MHC学习基础的行走、稳定性和全身运动跟踪,确保了学习过程的稳定性和效率。同时,通过优化的LSTM网络架构和细致设计的奖励函数,MHC能够在模拟环境中实现精确的动作跟踪,并在现实世界中展示出良好的性能。此外,文章还深入分析了MHC的局限性,并提出了未来研究的方向,为进一步提升人形机器人的全身控制技术奠定了基础。

4.核心思想与方法

MHC是从与躯干运动命令配对的再定位人体动作数据集中学习得到的。在训练和测试期间,可以对目标运动轨迹应用掩蔽,以产生掩蔽运动指令,这些指令被提供给MHC。然后,MHC生成整个身体的PD设定点,以跟踪当前的运动指令。训练包括领域随机化和力量扰动,以促进鲁棒性并从模拟转移到真实机器人。

本文算法概述

本文算法概述

5.实验仿真验证

6.限制

目前的一个主要限制是显著的仿真到现实(sim-to-real)差距。这在脚部放置较宽或一只脚在空中停留较长时间的动作中尤为明显。我们的假设是,这种仿真到现实的限制需要更多地集中于仿真到现实转移的研究,可能通过整合现实世界的数据来实现。MHC已经成为突显这些差距的有用工具。我们当前训练方法的另一个限制是,我们在训练期间只考虑了有限的掩蔽模式集。支持完全通用的掩蔽可能会导致额外的鲁棒性,并为行为创作开辟新的可能性。最后,MHC目前没有考虑到与外部物体的交互,例如在拾取箱子时与箱子的交互。将需要操纵的物体明确地整合到MHC的输入和训练中,是支持实际应用的重要方向。

本文仅做学术分享,如有侵权,请联系删文!

更多优质内容,请关注公众号:智驾机器人技术前线

  • 17
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值