- 深度强化学习导引:
http://mp.weixin.qq.com/s?__biz=MzI1NTE4NTUwOQ==&mid=2650324914&idx=1&sn=0baaf404b3d8132243d08b55310de210&scene=2&srcid=062732p5u33RRNIKUeDSlvXN&from=timeline&isappinstalled=0#wechat_redirect 详解深度强化学习,搭建DQN详细指南(基于Neon框架):
https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650716425&idx=1&sn=bf52c653b7cd054ce721ce5be928c623《Multiagent Cooperation and Competition with Deep Reinforcement Learning》Ardi Tampuu, Tambet Matiisen 15年11月份,是在deepMind Q-learning的基础上的一个扩展
http://arxiv.org/abs/1511.08779《Learning to Optimize》
强化学习的一个应用,把学习优化的过程加入了某些奖惩策略,利用强化学习的方式学习优化的方式,可参考
http://arxiv.org/abs/1606.01885
解读文章:
http://weibo.com/ttarticle/p/show?id=2309403985644224393104Deep Reinforcement Learning 深度增强学习资源
https://zhuanlan.zhihu.com/p/20885568《Dueling Network Architectures for Deep Reinforcement Learning》 Google DeepMind; University of Oxford; 15年11月 ,被引用10次以上
http://arxiv.org/abs/1511.06581Yoshua Bengio 最新论文:用于序列预测的actor-critic算法 http://t.cn/RtV9tL6
原文:http://arxiv.org/abs/1607.07086
摘要 提出了一种训练神经网络的方法以使用来自强化学习的 actor-critic 方法来生成序列。另外:ICML16强化学习相关论文24篇
http://weibo.com/p/1001603975123651678749
深度强化学习的入门资源汇总-2016.8
最新推荐文章于 2022-03-09 16:33:40 发布
本文汇总了深度强化学习的入门资源,包括深度强化学习导引、基于Neon框架的DQN搭建指南、多智能体合作与竞争的研究、学习优化的强化学习应用,以及DeepMind和Google的相关论文解读,为学习者提供了丰富的学习材料。
摘要由CSDN通过智能技术生成