1 简介
Rainbow是DeepMind提出的一种在DQN的基础上融合了6个改进的深度强化学习方法。
六个改进分别为:
(1) Double Q-learning;
(2) Prioritized replay;
(3) Dueling networks;
(4) Multi-step learning;
(5) Distributional RL;
(6) Noisy Nets.
Rainbow是model-free, off-policy, value-based, discrete的方法。
本文汇总了一些关于Rainbow的资料。
下面是Rainbow论文的下载地址:Rainbow: Combining Improvements in Deep Reinforcement Learningwww.aminer.cn
2 Rainbow
2.1 DQN
01原始论文
2013版:Playing Atari with Deep Reinforcement Learningwww.aminer.cn
2015版:Human-level control through deep reinforcement learningwww.aminer.cn
02 相关资料强化学习(九)Deep Q-Learning进阶之Nature DQNwww.cnblogs.com什么是 DQN - 强化学习 (Reinforcement Learning) | 莫烦Pythonmofanpy.comFrank Tian:【DRL-1】Deep Q Networkzhuanlan.zhihu.co