深度强化学习：深度解析 MADDPG

最新推荐文章于 2024-04-08 19:47:16 发布

汀、人工智能

最新推荐文章于 2024-04-08 19:47:16 发布

阅读量561

点赞数 1

分类专栏： # 强化学习多智能体原理+项目实战文章标签：人工智能深度学习深度强化学习强化学习多智能体算法

涉及博主原创类文章，未经博主许可不允许转载

本文链接：https://blog.csdn.net/sinat_39620217/article/details/131722810

版权

强化学习多智能体原理+项目实战专栏收录该内容

23 篇文章 51 订阅 ¥39.90 ¥99.00

订阅专栏

深度强化学习：深度解析 MADDPG

学习强化学习，码代码的能力必须要出众，要快速入门强化学习搞清楚其中真正的原理，读源码是一个最简单的最直接的方式。最近创建了一系列该类型文章，希望对大家有多帮助。
另外，我会将所有的文章及所做的一些简单项目，放在

1.MADDPG 原理

OpenAI 2017 论文《Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments》

知乎已经比较详细介绍了

本文主要分析该开源程序的架构。

该程序主要是对文章中的 environment 的实验进行房展

在试验中存在 agent 和 landmarks

实验一：speak 不能动但是可以看，listener 说一个颜色 listener 就到一个颜色的 landmark 上去

实验二：在这种经典的捕食者 - 食饵游戏变体中，N 个较慢的 Predator 在 Landmark 阻碍下追赶速度更快的 Prey

每一个 Predator 碰撞到 prey，代理人得到奖励，而对手受到惩罚。

了解本专栏

汀、人工智能

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
深度强化学习：深度解析 MADDPG

深度强化学习：深度解析 MADDPG
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

汀、人工智能 十分感谢您的支持

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。