论文速读|I-CTRL：通过受限强化学习使人型机器人模仿和控制

最新推荐文章于 2024-08-31 13:59:15 发布

28BoundlessHope

最新推荐文章于 2024-08-31 13:59:15 发布

阅读量146

点赞数 1

分类专栏：人形机器人文献阅读文章标签：机器人人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2301_81924597/article/details/141749905

版权

人形机器人文献阅读专栏收录该内容

11 篇文章 1 订阅

订阅专栏

论文地址：https://arxiv.org/pdf/2405.08726

I-CTRL（Imitation to Control Humanoid Robots Through Constrained Reinforcement Learning）是一个旨在解决现有人类运动到人型机器人的转换方法在物理可行性上的不足的框架。该框架通过在非物理基础的转换后的运动上施加受限的强化学习算法，提高了运动相似度，并确保了跟随参考人类轨迹的能力。研究团队对四种不同的人型机器人（Bruce、Atlas、H1 和 JVRC-1）进行了测试，证明了 I-CTRL 在不同机器人和大规模动作数据集上的泛化能力。通过使用简单且独特的奖励函数，I-CTRL 能够使用单一的强化学习代理来跟踪大约 10,000 种不同的动态运动。该研究的贡献包括：1) 实现了多种人型机器人的物理相容的人类 ähnliche 运动学习；2) 设计了一种新的样本高效的受限强化学习算法，该算法能够更好地保留目标运动的风格，并且能够泛化到大约 10,000 种运动，使用单一的策略和共享的奖励；3) 对四种不同的人型机器人进行了定量和定性的评估，展示了模型在不调整奖励的情况下的灵活性。

论文初读：

28BoundlessHope

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
论文速读|I-CTRL：通过受限强化学习使人型机器人模仿和控制

该框架通过在非物理基础的转换后的运动上施加受限的强化学习算法，提高了运动相似度，并确保了跟随参考人类轨迹的能力。该研究的贡献包括：1) 实现了多种人型机器人的物理相容的人类 ähnliche 运动学习；2) 设计了一种新的样本高效的受限强化学习算法，该算法能够更好地保留目标运动的风格，并且能够泛化到大约 10,000 种运动，使用单一的策略和共享的奖励；3) 对四种不同的人型机器人进行了定量和定性的评估，展示了模型在不调整奖励的情况下的灵活性。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。