深度强化学习系列 - J.Q.Wang (DeepRL)

最新推荐文章于 2024-07-28 15:37:27 发布

yuzhounh

最新推荐文章于 2024-07-28 15:37:27 发布

阅读量300

点赞数 1

文章标签：深度学习 tensorflow 强化学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yuzhounh/article/details/108292446

版权

深度强化学习系列(1): 深度强化学习概述

深度强化学习系列(2): ERROR: GLEW initalization error: Missing GL version

深度强化学习系列(3): 无

深度强化学习系列(4): Q-Learning原理与实现

深度强化学习系列(5): Double Q-Learning原理详解

深度强化学习系列(6): DQN原理及实现

深度强化学习系列(7): Double DQN(DDQN)原理及实现

深度强化学习系列(8): Prioritized Experience Replay(PER-DQN)原理及实现

深度强化学习系列(9): Dueling DQN(DDQN)原理及实现

深度强化学习系列(10): NoisyNet-DQN原理及实现

深度强化学习系列(11): 无

深度强化学习系列(12): 无

深度强化学习系列(13): 策略梯度（Policy Gradient）

深度强化学习系列(14): A3C算法原理及Tensorflow实现

深度强化学习系列(15): TRPO算法原理及Tensorflow实现

深度强化学习系列(16): 从DPG到DDPG算法的原理讲解及tensorflow代码实现

相关：

深度强化学习系列: OpenAI-baselines的使用方法

深度强化学习系列: 最全深度强化学习资料

深度强化学习系列: 深度强化学习实验中应该使用多少个随机种子？

深度强化学习系列: “超参数”与“网络结构”自动化设置方法---DeepHyper

深度强化学习系列: 深度强化学习的加速方法解读

深度强化学习系列: 多巴胺（Dopamine）环境配置和实例分析

深度强化学习系列: “奖励函数”的设计和设置（reward shaping）

参考文献：

1. 深度强化学习(DeepRL)探索博客_J.Q.Wang2011_CSDN博客 https://blog.csdn.net/gsww404

2. 深度强化学习系列_J.Q.Wang2011-CSDN博客 https://blog.csdn.net/gsww404/category_9273243.html

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
深度强化学习系列 - J.Q.Wang (DeepRL)

深度强化学习系列(1): 深度强化学习概述深度强化学习系列(2): ERROR: GLEW initalization error: Missing GL version深度强化学习系列(3): 无深度强化学习系列(4): Q-Learning原理与实现深度强化学习系列(5): Double Q-Learning原理详解深度强化学习系列(6): DQN原理及实现深度强化学习系列(7): Double DQN(DDQN)原理及实现深度强化学习系列(8): Prioritized E
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。