深度强化学习系列(2): ERROR: GLEW initalization error: Missing GL version
深度强化学习系列(3): 无
深度强化学习系列(5): Double Q-Learning原理详解
深度强化学习系列(7): Double DQN(DDQN)原理及实现
深度强化学习系列(8): Prioritized Experience Replay(PER-DQN)原理及实现
深度强化学习系列(9): Dueling DQN(DDQN)原理及实现
深度强化学习系列(10): NoisyNet-DQN原理及实现
深度强化学习系列(11): 无
深度强化学习系列(12): 无
深度强化学习系列(13): 策略梯度(Policy Gradient)
深度强化学习系列(14): A3C算法原理及Tensorflow实现
深度强化学习系列(15): TRPO算法原理及Tensorflow实现
深度强化学习系列(16): 从DPG到DDPG算法的原理讲解及tensorflow代码实现
相关:
深度强化学习系列: OpenAI-baselines的使用方法
深度强化学习系列: 深度强化学习实验中应该使用多少个随机种子?
深度强化学习系列: “超参数”与“网络结构”自动化设置方法---DeepHyper
深度强化学习系列: 多巴胺(Dopamine)环境配置和实例分析
深度强化学习系列: “奖励函数”的设计和设置(reward shaping)
参考文献:
1. 深度强化学习(DeepRL)探索博客_J.Q.Wang2011_CSDN博客 https://blog.csdn.net/gsww404
2. 深度强化学习系列_J.Q.Wang2011-CSDN博客 https://blog.csdn.net/gsww404/category_9273243.html