SkillMimic: Learning Reusable Basketball Skills from Demonstrations论文研读
SkillMimic基于强化学习学习多样化的篮球技能。SkillMimic使用的篮球数据集为两种:一是单目RGB视频数据Ballplay-V,二是动补数据Ballplay-M。设计了一种统一的回报设计(Unified skill imitation reward),计算每一步学习参考姿态的效果。同时回报项增加了物体的接触回报表示(即文中的Contact Graph表示)来加速学习效率(强化学习时常会让机器人学会一些不像人的或不期望的表现,例如用头和手同时接触篮球,完成篮球的抓取任务。
原创
2024-09-25 03:35:07 ·
1884 阅读 ·
0 评论