Imitation Learning and Model Integrated Excavator Trajectory Planning 论文解读

最新推荐文章于 2024-07-26 13:24:37 发布

zww614655386

最新推荐文章于 2024-07-26 13:24:37 发布

阅读量1k

点赞数 42

文章标签：人工智能机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zww614655386/article/details/139506639

版权

1、背景

目前自动挖掘机轨迹生成的两个方法：

基于模型轨迹规划：基于规则（使用规则生成轨迹，给定挖掘条件经过微调后可用但是缺乏泛化能力）、基于优化（试图根据挖掘机的运动学和逆运动学动态模型以及环境信息[6]，[7]，生成能够最小化（或最大化）某些目标的轨迹。在模型正确、数据足够的情况下，表现好，但是建模困难和多解的问题）
基于学习轨迹规划：从数据中生成挖掘轨迹，或者通过其他方法，如RL或者IL生成。

本文提出了：基于挖掘轨迹IL和模型优化的两阶段方法。收集数据，模仿学习获得策略后，使用Dagger在线收集轨迹并更新模仿学习策略。

2、方法

采集数据训练Actor网络后，在实际环境中运行Actor，输入新的s生成路径，人工检测路径是否合适，如果合适，则通过STOMP方法优化轨迹并让Fanka执行；若不够好，直接人工示教，轨迹交由Franka执行。

并且在每一回合收集数据后，使用Dagger方法优化Actor网络参数。

2.1 模仿学习(Actor网络)

输入：待挖区域信息（待挖物料相对高程+物料类型）、挖掘机状态

输出：挖机动作轨迹

2.1.1 地形信息

<

最低0.47元/天解锁文章

关注

42
点赞
踩
28

收藏

觉得还不错? 一键收藏
0
评论
Imitation Learning and Model Integrated Excavator Trajectory Planning 论文解读

本文关注的是挖掘作业，假定机械臂底部不转动，挖掘只与特定地形相关（如，挖掘区域最高点），所以提出介于界面体积的状态表示法，即：截面曲线等分为n个部分，对于每个部分，计算相对高度（绝对高度减去基座（机械臂底座）的绝对高度）作为该部分特征。对比训练（IL、STOMP、IL+STOMP）,每个实验进行15次挖掘（15次可以挖掘完物料），并保证物料三维特征一致情况下，基于规则POA算法找到POA，基于相同的POA物料特征做测试对比。（1）训练阶段采集更多数据，用于模型训练，不用online，降低现实交互的风险。
复制链接

扫一扫

zww614655386 CSDN认证博客专家 CSDN认证企业博客

码龄9年

3: 原创

61万+: 周排名

12万+: 总排名

4317: 访问

: 等级

133: 积分

78: 粉丝

103: 获赞

0: 评论

99: 收藏

私信

关注

热门文章

最新评论

Behavioral Cloning from Observation 论文阅读
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。