RL
RL
小芮猪
这个作者很懒,什么都没留下…
展开
-
[Distributed Training]强化学习并行训练论文合集
仅供自己参考学习使用。原文地址:https://zhuanlan.zhihu.com/p/77976582github:https://github.com/PaddlePaddle/PARL/blob/develop/papers/archive.md#distributed-training整体介绍强化学习需要的数据量其实是相当大的,在15年DQN发布的时候,要复现论文指标得和游戏交互10000000步。这个数量级在持续增长,deepmind 在训练AlphaGo的时候也是使用了上百块G转载 2020-09-05 11:28:48 · 579 阅读 · 0 评论 -
[model-free] 经典强化学习论文合集
仅供自己参考学习使用,如果有问题或者觉得内容不错,请去原文作者处点赞和讨论,谢谢。原文地址:https://zhuanlan.zhihu.com/p/89058164github:https://github.com/PaddlePaddle/PARL/blob/develop/papers/archive.md整体介绍这篇文章主要介绍经典的model-free 算法。对刚接触强化学习,然后又想深入了解RL的同学来说,是一个很好的论文合集。文章涵盖了首次用神经网络结合强化学习的D..转载 2020-09-05 11:26:29 · 345 阅读 · 0 评论 -
[Model-based]基于模型的强化学习论文合集
原文地址:https://zhuanlan.zhihu.com/p/72642285github:https://github.com/PaddlePaddle/PARL/blob/develop/papers/archive.md#model-based-rl仅供自己参考学习使用,如果有问题或者觉得内容不错,请去原文作者处点赞和讨论,谢谢。[背景]阻碍强化学习落地的致命缺点强化学习近些年在控制领域取得了相当大的突破,比如超越人类玩家平均水平的DQN算法,以及碾压所有人类选手的Alp..转载 2020-09-05 11:25:00 · 709 阅读 · 0 评论 -
RL算法改进汇总(会议)-2020
原文作者:https://www.zhihu.com/people/zhou-bo-54-20/postsgithub:https://github.com/PaddlePaddle/PARL/tree/develop/papers一、AAAI1. Proximal Distilled Evolutionary Reinforcement LearningCristian Bodnar, Ben Day, Pietro Lio ́简述:近期比较关注进化学习在强化学习问题上的应..转载 2020-09-05 11:06:35 · 964 阅读 · 0 评论