深度强化学习DDPG算法高性能Pytorch代码(改写自spinningup，低环境依赖，低阅读障碍)

最新推荐文章于 2023-02-06 18:01:13 发布

iπ弟弟

最新推荐文章于 2023-02-06 18:01:13 发布

阅读量3.8k

点赞数 13

分类专栏：强化学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43145941/article/details/112111312

版权

强化学习专栏收录该内容

19 篇文章 47 订阅 ¥9.90 ¥99.00

订阅专栏

写在前面

DRL各种算法在github上各处都是，例如莫凡的DRL代码、ElegantDRL（推荐，易读性NO.1）
很多代码不是原算法的最佳实现，在具体实现细节上也存在差异，不建议直接用在科研上。
这篇博客的代码改写自OpenAi spinningup源码DRL_OpenAI，代码性能方面不再是你需要考虑的问题了。
为什么改写？因为源码依赖环境过多，新手读起来很吃力，还有很多logger让人头疼。
这篇博客的代码将环境依赖降低到最小，并且摒弃了一些辅助功能，让代码更容易读懂。
如果本博客的代码在迁移至你的环境时依旧收敛不了，你的reward或者思路存在问题。

项目分三个文件：main.py , DDPGModel.py , core.py
Python3.6

DDPGModel.py

import numpy as np
from copy

了解本专栏

关注

13
点赞
踩
111

收藏

觉得还不错? 一键收藏
打赏
12
评论
深度强化学习DDPG算法高性能Pytorch代码(改写自spinningup，低环境依赖，低阅读障碍)

写在前面DRL各种算法在github上各处都是，例如莫凡的DRL代码、ElegantDRL普遍存在性能不行的情况，在具体实现细节上也存在差异，不建议直接用在科研上。这篇博客的代码改写自OpenAi spinningup源码DRL_OpenAI，在性能方面是不再是你需要考虑的问题了。为什么改写？因为源码依赖环境过多，新手读起来很吃力，还有很多logger让人头疼。这篇博客的代码将环境依赖降低到最小，并且摒弃了一些辅助功能，让代码更容易读懂。项目分三个文件：main.py , DDPGMode
复制链接

扫一扫

专栏目录

评论 12

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

iπ弟弟 如果可以的话，请杯咖啡吧！

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。