写在前面
- DRL各种算法在github上各处都是,例如莫凡的DRL代码、ElegantDRL(推荐,易读性NO.1)
- 很多代码不是原算法的最佳实现,在具体实现细节上也存在差异,不建议直接用在科研上。
- 这篇博客的代码改写自OpenAi spinningup源码DRL_OpenAI,代码性能方面不再是你需要考虑的问题了。
- 为什么改写?因为源码依赖环境过多,新手读起来很吃力,还有很多logger让人头疼。
- 这篇博客的代码将环境依赖降低到最小,并且摒弃了一些辅助功能,让代码更容易读懂。
- 如果本博客的代码在迁移至你的环境时依旧收敛不了,你的reward或者思路存在问题。
项目分三个文件:main.py , DDPGModel.py , core.py
Python3.6
DDPGModel.py
import numpy as np
from copy