Unity ML-Agent 训练工业机械臂到达目标点 数字孪生

本实验的硬件设备为intel i5 11代CPU,RTX3060显卡,数字孪生系统搭建平台为unity2021版,强化学习训练平台为Anaconda。本实验选取的机械臂模型为工业领域常见的KUKA六轴机械臂模型,如下图所示。

276f4847afae44d89f07266f0ff4df36.png

 KUKA六轴机械臂模型图

抓取目标为一立方体。限制条件如下:

  1. 待抓取目标的初始位置为距机械臂原点15cm(孪生系统中虚拟环境的距离数据)处,当待抓取目标被机械臂末端触碰到之后便随机更改位置,更改位置的范围限定在以初始位置为中心的10×5的矩形范围内。
  2. 设置机械臂各个关节之间为可配置铰链连接,并且参照物理模型的运动规律对每个关节转动的范围进行角度限制。
  3. 设置强化学习的初始参数为

表1 强化学习主要参数配置表

参数名称

参数值

batch_size

1024

buffer_size

20480

learning_rate

0.0003

beta

0.001

epsilon

0.2

ef0f75347e234b2bbae5c151664d6c70.png

图5 本实验训练过程图

训练过程如下图所示:

 

424b80f717ca459fb0fb17baf916fd1b.gif

 可以看到在训练过程中机械臂在空间中随机运动,目标物体在被触碰之后会变更位置。

经过一小时的训练,训练效果如图所示:

f027ad41ef86452ba60cd9b0c2f646bb.gif

初步实现了强化学习在机械臂上的应用。 可以通过多个机械臂共同训练来提高训练效率。

项目的demo链接https://download.csdn.net/download/wobuheniwanla/85437580

 

 

  • 5
    点赞
  • 46
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 23
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 23
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

发快没龙

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值