人形locomotion:Exbody/H2O/ASAP
文章平均质量分 94
包括且不限于Exbody、omniH2O、ASAP等等
v_JULY_v
七月在线创始人,结构之法算法之道blog之博主
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
HumanoidPF——让双足人形无碰撞穿越舱门的视觉-运动策略:基于人工势场APF和混合场景建模的全身RL算法
本文提出HumanoidPF方法,用于解决人形机器人在杂乱室内场景中的无碰撞穿越问题。该方法通过构建人工势场(Humanoid Potential Field)来编码机器人与障碍物的空间关系,为强化学习提供前瞻性指导。HumanoidPF既作为策略的观测信号,又简化了碰撞感知的奖励设计,显著提升了学习效率和泛化能力。作者还提出混合场景生成策略,通过程序化增强真实场景数据来扩展训练难度。实验表明,该方法在仿真和真实环境中均表现出色,并成功应用于远程操作系统Click-and-Traverse。相比现有工作,H原创 2026-02-01 23:30:55 · 3885 阅读 · 6 评论 -
BumbleBee——人形通用全身控制:先数据聚类、后每个聚类上训练专家策略(且通过增量动作模型弥补sim与real之间的差距)、最后蒸馏整合
现在号称 “人形通用全身控制” 的工作越来越多了,比如本文要介绍的BumbleBee此外,近期还有各种各大厂商千万级的订单,当然了,其更多还只是购买本体,还没到可以大规模干活的阶段毕竟实际开发者都懂,目前让人形跳舞容易,实际干活不容易然,不管怎么说,从运动到干活本质还是一个过程,也期待与更多的科研院所、高校、公司多多合作,共同加速具身的场景落地与实用化。原创 2025-09-06 12:12:59 · 3795 阅读 · 0 评论 -
GMT——用于人形全身控制的通用运动跟踪:两阶段师生训练框架下,全身基于单一策略,且自适应采样、MoE架构
本文介绍了人形机器人通用运动控制的最新研究进展,重点解读了GMT(通用运动跟踪)系统。该系统通过创新性的自适应采样策略和运动专家混合(MoE)架构,解决了人形机器人控制中的关键挑战:数据分布不均衡、硬件限制和模型表达能力不足等问题。研究采用两阶段师生训练框架,结合AMASS和LAFAN1数据集,开发出能实现多样化类人动作的单一统一控制器,包括行走、踢腿等复杂动作。相比传统方法需要为每个任务单独设计控制器,GMT展示了更通用的运动跟踪能力,为人形机器人在日常环境中的广泛应用奠定了基础。原创 2025-09-05 15:20:18 · 4170 阅读 · 0 评论 -
BeyondMimic——从跳舞好手到通过引导扩散实现多功能控制:基于Diffuse-CLoC构建扩散框架,可模仿动作、导航避障(含我司复现实践)
UniTracker是一个用于人形机器人全身运动跟踪的统一框架,通过集成条件变分自编码器(CVAE)来增强动作多样性和全局一致性。该框架采用三阶段训练:基于特权观测的教师策略训练、部分观测的学生策略学习,以及针对特定动作的快速微调。研究团队从AMASS数据集中筛选并重定向动作数据,使用SMPL模型参数表示人体动作,并通过两阶段方法将其适配到机器人模型。相比传统方法,UniTracker能更好地处理动作多样性、泛化能力和全局上下文问题,为人形机器人的locomotion控制提供了新思路。目前项目尚未开源,但展原创 2025-08-28 21:29:54 · 10046 阅读 · 16 评论 -
VideoMimic——一看视频就能学会:先real2sim(涉及视频作为输入、提取姿态且点云化、重定向到G1上),后sim中训练,最后sim2real
UC伯克利提出VideoMimic框架,通过单目视频实现人形机器人动作模仿。该方法从视频中重建4D人-场景几何,将动作重定向到机器人,并训练强化学习策略。系统包含四个阶段:预处理提取人体姿态和场景点云;联合优化人体与场景几何;生成仿真兼容的网格数据;通过多阶段策略学习实现动作跟踪和蒸馏。最终策略仅需本体感知和局部高度图即可控制机器人完成行走、攀爬等动作,并在Unitree G1机器人上验证成功。该方法无需人工奖励设计,直接从视频数据学习环境感知的全身控制技能。原创 2025-08-06 16:46:08 · 5725 阅读 · 0 评论 -
从RoboMimic、DeepMimic到带物理约束的MaskMimic——人形全身运控的通用控制器:自此打通人类-动画-人形的训练路径
摘要:本文探讨了机器人动作模仿技术DeepMimic及其改进方案MaskMimic的发展历程。该技术通过结合深度强化学习和动作跟踪,实现了让虚拟角色和机器人模仿人类动作的能力。相比传统需要为每个动作单独设计控制器的做法,DeepMimic采用统一的神经网络架构和跟踪型奖励机制,只需提供参考动作即可生成对应控制策略。文章还介绍了该技术在宇树G1机器人上实现查尔斯顿舞的实际应用案例,以及从DeepMimic到PHC(物理角色控制)的技术演进路径。原创 2025-06-30 23:40:55 · 6401 阅读 · 0 评论 -
KungfuBot——基于物理约束和自适应运动追踪的人形全身控制PBHC,用于学习打拳或跳舞(即RL下的动作模仿和运控)
《KungfuBot:基于物理的人形机器人全身控制方法解析》 摘要:本文介绍了最新开源的人形机器人控制框架KungfuBot,该研究由中国电信、上海交大等多所高校联合提出。该系统采用两阶段方法实现高动态动作模仿:首先通过物理指标筛选可行的人类动作数据,随后通过自适应运动跟踪机制训练控制策略。创新性地引入双层优化算法动态调整跟踪因子,并设计非对称的actor-critic架构提升训练效率。相比现有方法,KungfuBot能更好地处理敏捷动作,且仅需少量参考数据即可学习多样化行为。研究团队已完整开源项目代码,为原创 2025-06-19 19:10:57 · 9396 阅读 · 19 评论 -
ASAP的核心源码解析与训练部署——Delta增量动作模型、控制算法(比如力感知控制)的编码实现:含我司部署实践
摘要:ASAP框架创新性地结合增量学习与Delta动力学模型实现机器人运动控制优化。其核心模块包括:1)基于PPO扩展的双策略运动控制代理(DeltaA),通过主策略训练与参考策略对比实现增量学习;2)Delta动力学模型(DeltaDynamics),采用三层MLP网络预测状态变化量,并分解多分量损失进行精细优化。系统支持仿真与现实轨迹对齐,工作流程包含数据采集、策略优化和动力学建模三个关键环节,通过定期重采样、多维度损失计算和模型保存等机制提升训练效果。该框架为机器人运动控制提供了一种可扩展的增量学习方原创 2025-09-08 17:54:57 · 4323 阅读 · 0 评论 -
HumanoidVerse——CMU发布的用于人形sim2real训练的多模拟器框架(包含agents/envs/config/data):涉及师生网络、PPO、运动追踪
本文解析了ASAP开源代码框架,这是一个专注于人形机器人敏捷运动技能学习的平台。核心内容包括:1) 算法层实现PPO、DAgger等强化学习算法,支持增量学习等创新模块;2) 环境层提供运动控制和任务跟踪等场景;3) 模拟器层对接IsaacGym等多物理引擎。文章详细剖析了PPO训练流程、广义优势估计计算等关键技术实现,并介绍了双策略机制和参考策略加载等创新设计。该框架采用模块化架构,支持从仿真到现实的迁移学习,为人形机器人运动控制研究提供了完整的技术解决方案。原创 2025-06-21 23:46:39 · 5583 阅读 · 0 评论 -
ASAP——让宇树G1后仰跳投:先仿真中训练运动跟踪策略,然后通过sim与real的差距训练增量动作模型,最终修正动作以缩小差距实现对齐
作者在2025年2月首次看到CMU的ASAP项目,当时对机器人后仰跳投功能不以为然。一个月后,西湖机器人公司发布的宇树G1跳舞视频也未改变其看法。直到一个娱乐集团提出通过二次开发使机器人跳舞以促进消费,作者才意识到该技术的实际应用价值。作者反思了自己对技术潜在价值的忽视,并在与同事讨论后,决定深入研究CMU的ASAP工作。本文由此展开,探讨机器人跳舞技术的行业应用原创 2025-05-12 12:09:41 · 10741 阅读 · 6 评论 -
一次性总结数十个具身模型(24-25年Q1):从训练数据、动作预测、RL应用到Robotics VLM、VLA等(含模型架构、训练方法)
本文一开始是属于此文的前言的,但考虑到其重要性,加之那么大一张表格 看下来 阅读体验较差,故抽出取来独立成文且拆分之具身的论文解读过很多之后,便会发现整个今24年的具身模型/策略大概如下所示——目前全网独一份「(建议按照从下至上的顺序看,且,我后续也会不断完善之——毕竟还有很多并未囊括于下表中,如转载请于文章开头标明作者July及本文链接。原创 2025-02-01 15:20:33 · 23568 阅读 · 10 评论 -
从人类视频中学习的最新进展:从Humanoid-X(自动打字幕)、到首个人形VLA Humanoid-VLA
随着图形学领域中人类数据的日益丰富,近期的人形机器人控制越来越多地采用从人类数据中学习的方法。具体来说,给定来自物理遥操作(例如动作捕捉系统)的目标身体姿态以及人形机器人的本体感觉,全身控制器生成关节扭矩以控制人形机器人从形式上讲,这可以表示为其中表示目标身体姿态人形机器人的本体感受在时间t ∈N+ 时的关节力矩然而,开发一个通用机器人需要有目的的学习,这涉及从人类数据中提取有意义的意图,并将先前的经验适应于新的任务或环境目前的数据获取方法主要集中在人体关节姿态上,缺乏与第一人称视觉的整合。原创 2025-04-27 17:03:16 · 5487 阅读 · 0 评论 -
英伟达HOVER——用于人形机器人的多功能全身控制器:整合不同的控制模式且实现彼此之间的无缝切换
人形机器人是一种多功能的形态,支持多种机器人任务和应用,包括双手操作[1–3]、双足行走[4–7]和灵活的全身控制[8–14]。尽管这些努力展示了令人印象深刻的成果,每个项目都根据其特定任务和场景使用了不同的全身控制公式。原创 2024-11-06 19:54:35 · 7907 阅读 · 0 评论 -
基于人类视频的模仿学习与VLM推理规划:从DexMV、MimicPlay、SeeDo到人形OKAMI、Harmon(含R3M的详解)
在此文《》的1.1节开头有提到机器人收集训练数据一般有多种方式,比如Dexmv物理本体,有的翻译为embodiment38-Dexmv即embodiment-agnostic keypoint,49考虑到「从人类视频中学习」早已成为机器人的主流训练方法之一,故打算系统阐述以下这个课题,不然很多朋友可能只是理解其字面意思,但到底具体怎么个模仿学习,则不一定知其里,而通过本文系统的阐述,可以让大家更深刻的理解模仿学习背后更深的细节。原创 2024-10-20 22:57:24 · 10112 阅读 · 3 评论 -
Exbody 2——富有表现力的人形全身控制:Teacher–Student两阶段训练方式,基于CVAE做连续运动合成
UCSD团队开发的ExBody2是一种先进的人形机器人全身控制框架,通过两阶段教师-学生训练策略实现高精度动作模仿。该系统采用特权信息训练教师策略后,将其蒸馏为学生策略用于真实部署。创新性地使用了局部关键点跟踪策略和基于CVAE的运动合成技术,解决了全局跟踪误差累积和连续运动生成问题。实验表明,ExBody2在Unitree G1/H1平台上实现了优于基线方法的上半身/下半身协调跟踪表现。该系统克服了ExBody1分离控制的局限,通过全身协同mimic实现了更自然的舞蹈等高难度动作模仿。原创 2025-11-01 23:58:20 · 4554 阅读 · 0 评论 -
Exbody——从MDM、RobotMDM到全身运动控制策略Exbody:上半身模仿人体动捕数据,下半身RL训练
22年9月,来自TAU的研究者们通过此篇论文《》提出了运动扩散模型MDM,在该文中,作者通过在无分类器的方式下对CLIP进行条件化来实现文本到动作的转换,类似于文本到图像如下图所示「运动扩散模型(MDM)通过在给定文本提示的情况下生成多样化的动作,反映了文本到动作映射的多对多特性,其中,较深的颜色表示序列中的较晚帧,即最后生成的帧。原创 2024-10-11 23:25:20 · 7293 阅读 · 5 评论 -
H2O与OmniH2O——VR全身遥操的拓荒者:通过RGB摄像头或VR全身实时摇操,先仿真RL中训练,然后再sim2real(含师生学习与策略蒸馏详解)
由于我司一直在针对各个工厂、公司、客户特定的业务场景,做解决方案或定制开发,所以针对每一个场景,我们都会反复考虑用什么样的机器人做定制开发于此,便不可避免的追踪国内外最前沿的机器人技术进展,本来准备在上一篇博客《VLM驱动机器狗——从UMI on Legs到Helpful DoggyBot:分别把机械臂装到机器狗背上、夹爪装到机器狗嘴里》之后,解读今天上午看到的字节刚发的机器人大模型GR2。原创 2024-10-09 23:02:56 · 13257 阅读 · 12 评论 -
伯克利Digit——基于下一个token预测技术预测机器人动作token:从带RL到不带RL的自回归预测
本工作为语言交互的机器人操作策略提供了一个新颖的基于现有开源 VLMs 的框架,使用简单微调就能实现出色的效果。RoboFlamingo 为机器人技术研究者提供了一个强大的开源框架,能够更容易地发挥开源 VLMs 的潜能。工作中丰富的实验结果或许可以为机器人技术的实际应用提供宝贵的经验和数据,有助于未来的研究和技术发展参考文献:第二部分// 待更。原创 2024-01-28 00:00:55 · 7982 阅读 · 3 评论 -
rsl_rl——人形运控部署框架汇总:从经典RL框架rsl_rl到宇树开源的unitree_rl_gym(含unitree_sdk2_python)
本文介绍了一个强化学习框架rsl_rl,重点解析了其PPO算法的实现。该框架包含Actor-Critic网络(包括普通版、CNN版、历史记忆版和RNN版)、PPO算法实现、训练运行器等核心组件。在PPO实现部分,详细说明了其初始化过程、动作选择、环境交互处理、回报计算和参数更新机制。其中参数更新采用了裁剪优势估计、自适应学习率调整等技术,通过代理损失、价值函数损失和熵奖励三部分构成总损失进行梯度优化。框架支持多种输入数据类型,并实现了超时引导、GAE回报计算等强化学习关键技术,为策略优化提供了稳定高效的实现原创 2025-11-02 00:18:25 · 6623 阅读 · 0 评论 -
GMR——人形动作追踪的通用动作重定向:在不做复杂奖励和域随机化的前提下,缓解或消除重定向带来的伪影(含PHC的详解)
摘要:本文深入解析了通用动作重定向(GMR)方法,旨在解决人形机器人运动跟踪中的关键问题。由于人类与机器人在形态结构上的显著差异,传统重定向方法常导致脚滑、穿透等物理伪影。GMR通过五步流程实现优化:1)关键部位匹配;2)静止姿态对齐;3)局部非均匀缩放;4)带旋转约束的逆运动学求解;5)精调优化。实验表明,相比PHC等方法,GMR能有效减少伪影,提升动作质量,为人形机器人动作学习提供更可靠的数据基础。原创 2025-10-30 18:55:45 · 6850 阅读 · 0 评论 -
Video2Motion之GVHMR——基于重力-视角坐标的人体运动恢复:从RGB视频中提取人的SMPL轨迹(含人体姿态估计WHAM的详解)
本文系统介绍了三种3D人体姿态估计方法:WHAM、HaMeR和GVHMR。重点阐述了WHAM的架构设计,它通过结合ViTPose检测的2D关键点和图像特征,利用RNN编码运动上下文,实现从视频到SMPL参数的精确估计。文章详细解析了WHAM的两阶段训练策略:先在AMASS数据集预训练,再在真实视频数据上微调。同时介绍了WHAM的创新点,包括全局轨迹解码器设计和接触感知轨迹优化方案,有效解决了脚滑问题。这些方法共同构成了从单目视频重建带世界坐标系3D人体运动的技术体系,为具身智能研究提供了重要基础。原创 2025-10-28 21:02:34 · 5245 阅读 · 0 评论 -
SMPL-X——对人体建模之SMPL-X和AMASS数据集的详解:包含人形自主搬运之下全身动捕系统的从零搭建(含手眼标定的详解)
根据arXiv的记录,此篇论文的提交记录为[Submitted on 12 Dec 2023 (v1), last revised 18 Apr 2024 (this version, v2)]如下图所示,WHAM的输入是由可能具有未知运动的相机捕获的原始视频数据,接下来的目标是预测对应的SMPL模型参数序列,以及在世界坐标系中表达的根方向和平移,具体做法是。原创 2024-06-22 17:39:48 · 9690 阅读 · 1 评论 -
斯坦福人形HumanPlus的代码解读与复现关键:从HST(含rsl_rl)到HIT、HardWare
本文一开始是属于此文的第四部分,但为避免原文篇幅过长,故把该部分抽取出来独立成文过程中解读斯坦福人形机器人humanplus的代码时,还是充满乐趣的,比如又遇到了熟悉的ppo,想到也算是可谓三者合一、步步为赢了大模型时代,技术更迭速度超过以往任何,而个人认为机器人(具身智能)将是未来几年最大的趋势,包括我司机器人线下营曾一天连报5人(开营后,将邀请一波人加入我司机器人开发队伍),愿与有缘人共同开发机器人。原创 2024-06-19 10:40:58 · 10891 阅读 · 19 评论 -
HumanPlus——斯坦福ALOHA团队开源的像人类影子一样的人形机器人:仿真中训小脑HST、真实中训大脑HIT
今天只是一个平常的日子,不过看到了两篇文章一篇是《半年冒出近百家新公司,「具身智能」也有春天》我看完之后转发到朋友圈,并评论道:让机器人翻一万个后空翻,不如让机器人打好一个螺钉,毕竟在目前阶段 炫酷没有意义,所以我们近期全力为工厂去赋能,解决一个个工业场景期待我司与更多工厂合作,从前期的验证、评估开始另外一篇文章便是之前斯坦福Moblie aloha团队竟然开源推出了他们的人形机器人,虽然我司下半年暂不涉足人形机器人(更多还是解决工厂实际业务场景 怎么把活干好、干漂亮则怎么来,是否人形不重要)原创 2024-06-16 12:25:12 · 22556 阅读 · 18 评论
分享