Unity3D ML-Agent-0.8.1 学习三（多代理学习）

最新推荐文章于 2023-03-07 16:51:16 发布

王伟王胖胖

最新推荐文章于 2023-03-07 16:51:16 发布

阅读量854

点赞数 1

分类专栏：强化学习 Unity3D Ml-Agent 深度学习文章标签： Unity3D Unity3D ml-gent ml-gent 深度学习强化学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wangwei19871103/article/details/90370656

版权

深度学习同时被 3 个专栏收录

75 篇文章 13 订阅

订阅专栏

15 篇文章 2 订阅

订阅专栏

Unity3D Ml-Agent

7 篇文章 8 订阅

订阅专栏

Unity3D ML-Agent-0.8.1 学习三（多代理学习）

写的目的

本篇主要接着上一篇，介绍多代理训练，思路就是将训练的环境变成预制，然后在场景中多加几个预制，一起训练，效果确实比单个训练快多了，毕竟样本多了，加速了训练。注意多代理训练，代码里的一些位置，速度信息就需要设置成相对父类的坐标，不能设置成世界坐标，否则都挤一堆去了，这样各自在各自的训练区域里训练即可。
在这里插入图片描述

多代理设置

复制之前的单代理的场景，改个名字，我的叫MultipleRollerBall，然后创建一个新的空物体叫TrainingArea，然后把相应的物体拖进去，当子物体，做成一个预制，即训练平台，这样每个训练平台都是相互隔离的，不会有影响。
在这里插入图片描述
记得创建一个新的训练大脑，属性跟单代理一样，也可以直接将要复制属性的单代理拖到红框里，Model训练时可以为空，测试时拖进去就即可。

然后你就把预制往场景拖，隔开放就行，不要挨着太近，小球可能会卡中间不掉下去。
在这里插入图片描述

创建目录

然后还是老样子训练，具体可见上几篇，没什么变化，可以看到输出的信息，千次训练时间长了，但是获得奖励提高了，达到最优的情况的时间缩短了，主要参数在这里插入图片描述
结果还是很不错的，可以对比单代理，快了好几倍了：

也可以看总结图，到达最好奖励的速度很快：

总结

可以看到，用多代理确实比单代理要快好多，接下去可能会研究下模仿学习，例子还是这个例子，慢慢扩展，尽情期待吧。

例子主要文件unity3D-ml-agent-0.8.1

好了，今天就到这里了，希望对学习理解有帮助，大神看见勿喷，仅为自己的学习理解，能力有限，请多包涵，部分图片来自网络，侵删。

王伟王胖胖

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
2
评论
Unity3D ML-Agent-0.8.1 学习三（多代理学习）

Unity3D Ml-Agent-0.8.1 学习三写的目的多代理设置创建目录总结写的目的本篇主要接着上一篇，介绍多代理训练，思路就是将训练的环境变成预制，然后在场景中多加几个预制，一起训练，效果确实比单个训练快多了，毕竟样本多了，加速了训练。注意多代理训练，代码里的一些位置，速度信息就需要设置成相对父类的坐标，不能设置成世界坐标，否则都挤一堆去了，这样各自在各自的训练区域里训练即可。多代...
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。