maddpg
孙敬博
这个作者很懒,什么都没留下…
展开
-
maddpg Gumbel-Softmax Trick
https://www.cnblogs.com/initial-h/p/9468974.html转载 2020-06-11 21:50:56 · 918 阅读 · 0 评论 -
MADDPG 连续动作noise trick
在maddpg中,对于连续动作鼓励探索时,使用的是OU noise方法,该方法是自相关的。# OU noise是自相关的,后一步的噪声受前一步的影响(且是马尔科夫的)。而第一部分阐述的高斯噪声,前后两步都是完全独立的。class OU_noise: def __init__(self,action_dim ,miu = 0, theta = 0.15, sigma = 0.2, dt = 0.1,scale = 0.1): self.miu = miu self.原创 2020-06-11 21:41:29 · 835 阅读 · 0 评论