![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
分布强化学习
GPlearndunk
跟程序员抢饭吃的机械小硕
展开
-
基于分位数回归的分布强化学习(Distributional Reinforcemet Learning with Quantile Regression)
引入Deep Mind团队联合剑桥大学在2017年提出了一种新的强化学习范式——基于分位数回归的分布强化学习(QR-DRL),为强化学习的未来发展指明了一个更加有前景的方向,以学习回报值的概率分布来代替学习回报值的期望值。Deep Mind的论文通过在atari游戏中的实验,证明了QR-DRL的强大性能,在众多游戏中都达到了state-of-art。私以为QR-DRL是近年来为数不多的,从根本理...原创 2019-05-20 22:27:54 · 5567 阅读 · 0 评论 -
GAN-DQN
GAN-DQN本期介绍一项来自麦吉尔大学的有趣工作,它拓展了分布强化学习在深度学习框架下的应用,提出了一个十分有趣的深度强化学习框架:GAN+DQN。文章验表明,GAN-DQN对于高度复杂的强化学习任务尤其有效,在最终控制效果以及减小回报值方差方面都有长足的改进。在这里先放出结果图供诸君一览,领略一下GAN-DQN的优势:从结果上看,可知GAN-DQN在收敛速度上并没有优势,甚至有着一些劣势...原创 2019-05-21 14:42:32 · 1263 阅读 · 0 评论 -
QUOTA——对分布强化学习的探索策略改进
QUOTA:The Quantile Option Architecture for Reinforcement Learning今天!我们要介绍的是来自于Alberta大学与华为诺亚实验室合作的一项研究,该研究是对分布强化学习中探索策略的一个改进,其中所蕴含的分布强化学习框架下的探索思想非常值得学习,可以说是大大拓展了我的视野。这里说个题外话,最近中美贸易摩擦导致华为遭到美国的严厉打击,众多科...原创 2019-05-23 16:18:02 · 938 阅读 · 0 评论