Unity3D ML-Agent-0.8.1 学习三(多代理学习)

Unity3D ML-Agent-0.8.1 学习三(多代理学习)

写的目的

本篇主要接着上一篇,介绍多代理训练,思路就是将训练的环境变成预制,然后在场景中多加几个预制,一起训练,效果确实比单个训练快多了,毕竟样本多了,加速了训练。注意多代理训练,代码里的一些位置,速度信息就需要设置成相对父类的坐标,不能设置成世界坐标,否则都挤一堆去了,这样各自在各自的训练区域里训练即可。
在这里插入图片描述

多代理设置

复制之前的单代理的场景,改个名字,我的叫MultipleRollerBall,然后创建一个新的空物体叫TrainingArea,然后把相应的物体拖进去,当子物体,做成一个预制,即训练平台,这样每个训练平台都是相互隔离的,不会有影响。
在这里插入图片描述
记得创建一个新的训练大脑,属性跟单代理一样,也可以直接将要复制属性的单代理拖到红框里,Model训练时可以为空,测试时拖进去就即可。
在这里插入图片描述
然后你就把预制往场景拖,隔开放就行,不要挨着太近,小球可能会卡中间不掉下去。
在这里插入图片描述

创建目录

然后还是老样子训练,具体可见上几篇,没什么变化,可以看到输出的信息,千次训练时间长了,但是获得奖励提高了,达到最优的情况的时间缩短了,主要参数在这里插入图片描述
结果还是很不错的,可以对比单代理,快了好几倍了:
在这里插入图片描述
也可以看总结图,到达最好奖励的速度很快:
在这里插入图片描述

总结

可以看到,用多代理确实比单代理要快好多,接下去可能会研究下模仿学习,例子还是这个例子,慢慢扩展,尽情期待吧。

例子主要文件unity3D-ml-agent-0.8.1

好了,今天就到这里了,希望对学习理解有帮助,大神看见勿喷,仅为自己的学习理解,能力有限,请多包涵,部分图片来自网络,侵删。

  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值