人形机器人文献阅读
28BoundlessHope
这个作者很懒,什么都没留下…
展开
-
论文速读|通过 SERL 算法优化轻量级双足机器人结构
这篇论文展示了SERL算法在双足机器人结构参数设计中的有效性,提供了推进该领域的重要见解。通过结合强化学习运动控制策略和进化算法,SERL算法成功识别出在指定设计空间内最能满足任务要求的结构参数值。与设计空间内的其他参数相比,验证了SERL算法在实现理论最优值方面的卓越性能。此外,将SERL算法的优化结果应用于实际设计,创造性地开发了Wow Orin双足机器人。未来工作将把SERL算法应用于其他参数和任务,改进算法以实现多个设计参数的协同优化。原创 2024-09-11 06:30:00 · 234 阅读 · 0 评论 -
论文速读|形机器人的高速和抗冲击远程操作
本文提出了一种综合解决方案,用于远程控制类人机器人,实现了高速度和冲击抵抗的操作。通过结合无校准的运动捕捉和重定标、低延迟全身运动流式传输工具箱和高带宽的摆线驱动器,显著提高了机器人控制的透明度和同步性。实验结果表明,该系统在高速运动和冲击环境下表现出色,达到了前所未有的性能水平。原创 2024-09-10 23:30:00 · 286 阅读 · 0 评论 -
论文速读|快速且稳健的人形机器人轨迹优化
这篇论文提出了一种新颖的全尺寸人形机器人轨迹优化算法,能够在几秒钟内生成的可行步态。该方法在能效和实现期望行为方面优于现有的最先进规划器。未来工作将涉及将优化后的轨迹转移到真实世界硬件上。原创 2024-09-04 23:00:00 · 304 阅读 · 0 评论 -
论文速读|重新审视奖励设计与评估:用于强健人型机器人站立与行走控制的方法
这篇论文为类人机器人站立和行走(SaW)控制器的持续可衡量改进奠定了基础。通过引入一套定量实际基准测试方法,作者展示了现有控制器的优缺点,并通过基准测试指导新控制器的训练,最终实现了增强的控制器,成功处理了所有测试的扰动。结果表明,当前的RL控制器在能量效率和仿真到现实差距方面存在局限性。未来的工作应专注于在不牺牲其他指标性能的情况下优化能量效率,以及提高运动的平稳性。原创 2024-09-04 22:00:00 · 574 阅读 · 0 评论 -
论文速读|全身人形机器人的仿人运动研究
通过引入对抗性运动先验和多种奖励函数,成功解决了传统强化学习中复杂的奖励函数设置问题,减少了Sim2Real差距,提高了学习能力和适应性。- 研究展示了如何通过创新的对抗性运动先验框架和强化学习方法,使类人机器人能够模仿人类的行走方式,并在复杂环境中表现出高度的鲁棒性和适应性。- 实验结果显示,Adam机器人在复杂步态任务中的表现与人类相当,首次实现了类人机器人的“脚跟到脚趾”跑跳步态。- 在真实机器人实验中,测试机器人在外部干扰下的鲁棒行走性能,展示其“直膝”和“脚跟到脚趾”的跑跳步态。原创 2024-09-04 20:00:00 · 424 阅读 · 0 评论 -
论文速读|BiGym:一款基于演示的移动双手操作机器人基准
BiGym 是一个针对移动双手操作的机器人学习基准,包含 40 个在家庭环境中进行的任务,如简单的目标接近到复杂的厨房清洁。BiGym 提供了人类收集的演示,反映了现实世界中机器人轨迹的多模态特性。该基准支持多种观察空间,包括机器人的 orszens 感知数据和视觉输入,如来自三个相机视角的 RGB 和深度图像。BiGym 支持两种操作模式:整体模式和双手操作模式,分别考虑和不考虑移动基体的控制。此外,BiGym 还提供了一个标准的 Gymnasium API 接口,用于训练和评估强化学习和模仿学习算法。原创 2024-09-04 00:00:00 · 653 阅读 · 0 评论 -
论文速读|自然语言的最优控制合成:机遇与挑战
介绍了一种从自然语言自动生成最优控制器的框架,该框架主要包括以下几个步骤:首先,通过人类用户提供的初始文本和系统描述,利用大型语言模型生成控制器模型。最后,根据评估结果生成反思提示,以指导未来对控制器模型的改进。网页还指出,目前的关键问题包括语言模型的反思能力不足、处理动态任务的难题、以及确保系统安全性。此外,文章通过实验验证了语言模型在生成系统动力学和约束方面的能力,并讨论了如何通过编程库自动计算函数梯度,以及如何通过多样化的控制器模型生成来减少代码错误的风险。原创 2024-09-03 11:30:52 · 179 阅读 · 0 评论 -
论文速读|RoboCasa:用于通用家用机器人的大规模日常任务模拟
该框架支持不同类型的机器人,包括移动操作机器人和类人机器人,并提供了 100 个多样化的任务,用于系统评估。这些任务包括基础的传感器运动技能,如抓取和放置、开关门、打开抽屉等,以及更复杂的组合任务,如烹饪和清洁活动。实验结果表明,通过模拟生成的数据可以显著提高机器人政策学习的性能,并且在现实世界中的任务中也表现出了良好的效果。RoboCasa 利用生成式 AI 工具,如文本到 3D 模型的转换,以及文本到图像模型的环境纹理,来创建多样化的环境和任务。原创 2024-09-01 14:39:11 · 460 阅读 · 0 评论 -
论文速读|人形机器人的表达性全身控制
此外,该研究还讨论了为什么计算机图形学领域中的物理基础角色动画方法不适合直接应用于现实世界中的人形机器人,以及为什么需要 ExBody 方法来解决这个问题。研究团队提出了一种名为 ExBody(Expressive Whole-Body Control)的控制策略,旨在使人形机器人能够模仿人类的多样化和表达性强的运动。为了适应现实世界中的机器人硬件限制,ExBody 方法鼓励机器人的上半身模仿参考运动,同时对其两条腿的模仿约束进行放宽,只要求腿部跟随给定的根部运动命令稳健地行走。原创 2024-09-01 09:42:53 · 347 阅读 · 0 评论 -
论文速读|全身人型机器人控制学习与序列接触
WoCoCo(Whole-Body Control with Sequential Contacts)框架通过将任务分解为多个接触阶段,简化了策略学习流程,使得 RL 策略能够通过任务无关的奖励和模拟到现实的设计来学习复杂的人型机器人控制任务。该框架仅需要对每个任务指定少量任务相关的奖励项。WoCoCo 框架的核心在于其奖励设计,包括密集的接触奖励、阶段计数奖励和好奇心奖励,这些奖励促进了机器人在不同接触阶段的探索,并且通过一个通用的模拟到现实的训练流程,实现了对不同任务的适应。原创 2024-08-31 13:59:15 · 398 阅读 · 0 评论 -
论文速读|I-CTRL:通过受限强化学习使人型机器人模仿和控制
该框架通过在非物理基础的转换后的运动上施加受限的强化学习算法,提高了运动相似度,并确保了跟随参考人类轨迹的能力。该研究的贡献包括:1) 实现了多种人型机器人的物理相容的人类 ähnliche 运动学习;2) 设计了一种新的样本高效的受限强化学习算法,该算法能够更好地保留目标运动的风格,并且能够泛化到大约 10,000 种运动,使用单一的策略和共享的奖励;3) 对四种不同的人型机器人进行了定量和定性的评估,展示了模型在不调整奖励的情况下的灵活性。原创 2024-08-31 11:16:24 · 423 阅读 · 0 评论 -
DrEureka:语言模型引导的模拟到现实的迁移01|论文初读
项目地址:https://eureka-research.github.io/dr-eureka/(腾讯元宝)论文初读:原创 2024-08-19 20:49:24 · 192 阅读 · 0 评论 -
论文速读|通过人类远程操作的深度模仿学习框架:人型机器人的行走操纵技能
TRILL 由三个主要部分组成:一个基于 VR 的远程操作接口、一个整体控制器和一个数据高效的模仿学习算法。研究人员通过模拟和现实中的实验验证了 TRILL 的有效性,并在两个仿真环境(门和工作台)以及现实中的 DRACO 3 人型机器人上进行了部署。此外,研究还探讨了不同的观测和行动空间设计对策略性能的影响,以及不同数据集大小对学习效率的影响。最后,TRILL 在现实中的部 ployment 证明了其在现实世界人型机器人系统中的鲁棒性和实用性。原创 2024-08-31 10:10:12 · 442 阅读 · 0 评论 -
论文速读|通过示范学习重用篮球技能的 SkillMimic:学习多种篮球技能的数据驱动方法
该方法不需要为每种技能设计特定的奖励函数,而是通过一个统一的配置来学习不同的技能,这使得训练一个单一的策略就能学习多种技能,并实现技能的平滑切换。此外,研究还提出了一个高层控制器(High-Level Controller, HLC)来重用学习到的技能,以完成更复杂的篮球任务,如连续得分。实验结果表明,SkillMimic 在学习篮球技能和完成复杂任务方面表现出色,并且随着数据集规模的增加,学习到的技能能力也在不断提升。原创 2024-08-30 09:44:18 · 271 阅读 · 0 评论 -
论文速读|RT-2:视觉 - 语言 - 行动模型将网络知识转移至机器人控制
RT-2 通过将机器人行动表示为文本令牌,并将其与来自网络的视觉 - 语言任务一起训练,实现了将网络知识转移到机器人控制的目标。研究团队采用了两种特定的 VLMs,即 PaLI-X 和 PaLM-E,并将它们训练成 RT-2-PaLI-X 和 RT-2-PaLM-E 两种模型。此外,RT-2 还展现了一些新的能力,如符号理解、推理和人类识别,这些能力是通过从网络规模的视觉 - 语言数据中学习到的知识转移而来的。原创 2024-08-28 11:08:32 · 143 阅读 · 0 评论 -
论文速读|CrossFormer:扩展跨体学习以用于操作、导航、行走和航空的先进策略
CrossFormer 是一个基于变换器的机器人策略,它能够消耗来自任何体型的数据,并且在最大、最多样化的数据集上进行训练,这个数据集包含 30 种不同机器人体型的 900,000 个轨迹。此外,该研究还提供了每个动作模式的评估视频,并与先前的最佳方法进行了比较,其中包括了观察空间和动作空间对齐的方法,如 Yang et al. 的工作。CrossFormer 是一种先进的跨体学习机器人策略,能够在不同动作空间的六种不同机器人体型上实现最佳性能,无需进行任何动作空间的对齐。原创 2024-08-22 21:04:31 · 276 阅读 · 0 评论 -
论文速读|VMP:多功能运动先验用于鲁棒追踪物理角色上的运动
本文介绍了一种名为 VMP(Versatile Motion Priors)的技术,旨在通过一个两阶段的过程来控制物理角色,使其能够准确地追踪用户指定的运动参考。在第一阶段,研究者们通过训练一个变分自编码器(VAE)来从未经过滤的大规模运动数据集中提取运动的潜在空间表示。本研究提出了一种双阶段技术,用于在物理角色上精确追踪全身运动参考,通过训练一个变分自编码器来提取运动的潜在表示,并基于这一表示训练一个条件策略,以实现从运动输入到动力学输出的映射,从而实现对复杂运动的精确控制。原创 2024-08-22 20:48:50 · 358 阅读 · 0 评论 -
论文速读|CusADi:用于符号表达式和最优控制的 GPU 并行化框架
本文介绍了 CusADi,一个支持 CUDA 的 GPU 并行化框架,用于优化控制和符号表达式的并行计算,显著提高了模型预测控制(MPC)算法的计算速度。CusADi 是一个基于 casadi 符号框架的 GPU 并行化扩展,旨在并行化任意闭合形式的表达式,并提出了一种解决通用最优控制问题的近似闭合形式解法。该研究展示了相对于 CPU 实现的 MPC,CusADi 能够实现十倍的速度提升,并在多种机器人应用中证明了其有效性,包括并行仿真、参数扫描和策略训练。原创 2024-08-21 14:27:32 · 231 阅读 · 0 评论