莫烦python简历_Rainbow: 融合DQN六种改进的深度强化学习方法！

最新推荐文章于 2024-04-19 10:37:00 发布

Jacob贾超

最新推荐文章于 2024-04-19 10:37:00 发布

阅读量1.1k

点赞数

文章标签：莫烦python简历

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_32859127/article/details/112025993

版权

1 简介

Rainbow是DeepMind提出的一种在DQN的基础上融合了6个改进的深度强化学习方法。

六个改进分别为：

(1) Double Q-learning；

(2) Prioritized replay；

(3) Dueling networks；

(4) Multi-step learning；

(5) Distributional RL；

(6) Noisy Nets.

Rainbow是model-free, off-policy, value-based, discrete的方法。

本文汇总了一些关于Rainbow的资料。

下面是Rainbow论文的下载地址：Rainbow: Combining Improvements in Deep Reinforcement Learningwww.aminer.cn

2 Rainbow

2.1 DQN

01原始论文

2013版：Playing Atari with Deep Reinforcement Learningwww.aminer.cn

2015版：Human-level control through deep reinforcement learningwww.aminer.cn

02 相关资料强化学习(九)Deep Q-Learning进阶之Nature DQNwww.cnblogs.com什么是 DQN - 强化学习 (Reinforcement Learning) | 莫烦Pythonmofanpy.comFrank Tian：【DRL-1】Deep Q Networkzhuanlan.zhihu.co

最低0.47元/天解锁文章

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
莫烦python简历_Rainbow: 融合DQN六种改进的深度强化学习方法！

1 简介Rainbow是DeepMind提出的一种在DQN的基础上融合了6个改进的深度强化学习方法。六个改进分别为：(1) Double Q-learning；(2) Prioritized replay；(3) Dueling networks；(4) Multi-step learning；(5) Distributional RL；(6) Noisy Nets.Rainbow是model-f...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。