- 博客(3)
- 资源 (6)
- 收藏
- 关注
原创 Imitation Learning and Model Integrated Excavator Trajectory Planning 论文解读
本文关注的是挖掘作业,假定机械臂底部不转动,挖掘只与特定地形相关(如,挖掘区域最高点),所以提出介于界面体积的状态表示法,即:截面曲线等分为n个部分,对于每个部分,计算相对高度(绝对高度减去基座(机械臂底座)的绝对高度)作为该部分特征。对比训练(IL、STOMP、IL+STOMP),每个实验进行15次挖掘(15次可以挖掘完物料),并保证物料三维特征一致情况下,基于规则POA算法找到POA,基于相同的POA物料特征做测试对比。(1)训练阶段采集更多数据,用于模型训练,不用online,降低现实交互的风险。
2024-06-07 14:10:02 1104
原创 Behavioral Cloning from Observation 论文阅读
M:假定操作空间是连续的且遵循高斯分布(正态分布),使用最大似然数估计获得模型参数θ训练阶段:输入:状态—动作对,训练模型收敛判断方法;随机梯度的Adam变体测试阶段:输入:状态输出:动作(这里的动作是网络输出的多个动作经过sofrmax计算概率后取最大的动作)Π:同样采取最大似然数估计参数训练阶段:输入一个任务的操作过程((s0,a0),(s1,a1),...,(sn,an)),经过训练得到一个模型。测试阶段:输入:状态(论文只是个方法论,没有说明是输入数据类型,数据集没法说。
2024-06-04 09:34:21 1833
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人