深度强化学习的入门资源汇总-2016.8

最新推荐文章于 2022-03-09 16:33:40 发布

shincling

最新推荐文章于 2022-03-09 16:33:40 发布

阅读量4.6k

点赞数

分类专栏：深度学习强化学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/shincling/article/details/52144015

版权

深度学习同时被 2 个专栏收录

8 篇文章 1 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

本文汇总了深度强化学习的入门资源，包括深度强化学习导引、基于Neon框架的DQN搭建指南、多智能体合作与竞争的研究、学习优化的强化学习应用，以及DeepMind和Google的相关论文解读，为学习者提供了丰富的学习材料。

摘要由CSDN通过智能技术生成

深度强化学习导引：
http://mp.weixin.qq.com/s?__biz=MzI1NTE4NTUwOQ==&mid=2650324914&idx=1&sn=0baaf404b3d8132243d08b55310de210&scene=2&srcid=062732p5u33RRNIKUeDSlvXN&from=timeline&isappinstalled=0#wechat_redirect
详解深度强化学习，搭建DQN详细指南（基于Neon框架）：
https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650716425&idx=1&sn=bf52c653b7cd054ce721ce5be928c623
《Multiagent Cooperation and Competition with Deep Reinforcement Learning》Ardi Tampuu, Tambet Matiisen 15年11月份，是在deepMind Q-learning的基础上的一个扩展
http://arxiv.org/abs/1511.08779
深度强化学习导引：
https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650716246&idx=2&sn=2c328097a95839871c8c91c5c5af9de5
《Learning to Optimize》

强化学习的一个应用，把学习优化的过程加入了某些奖惩策略，利用强化学习的方式学习优化的方式，可参考
http://arxiv.org/abs/1606.01885
解读文章：
http://weibo.com/ttarticle/p/show?id=2309403985644224393104
Deep Reinforcement Learning 深度增强学习资源
https://zhuanlan.zhihu.com/p/20885568
《Dueling Network Architectures for Deep Reinforcement Learning》 Google DeepMind; University of Oxford; 15年11月，被引用10次以上
http://arxiv.org/abs/1511.06581
Yoshua Bengio 最新论文：用于序列预测的actor-critic算法 http://t.cn/RtV9tL6
原文：http://arxiv.org/abs/1607.07086
摘要提出了一种训练神经网络的方法以使用来自强化学习的 actor-critic 方法来生成序列。
另外：ICML16强化学习相关论文24篇
http://weibo.com/p/1001603975123651678749

关注

0
点赞
踩
9

收藏

觉得还不错? 一键收藏
4
评论
深度强化学习的入门资源汇总-2016.8

近期深度强化学习的一些资源汇总
复制链接

扫一扫

专栏目录

shincling CSDN认证博客专家 CSDN认证企业博客

码龄9年

22: 原创

22万+: 周排名

54万+: 总排名

41万+: 访问

: 等级

1379: 积分

83: 粉丝

128: 获赞

60: 评论

341: 收藏

私信

关注

热门文章

分类专栏

深度学习 8篇
linux 1篇
机器学习 2篇
python 5篇
强化学习 1篇

最新评论

关于python数组对象“=”的小陷阱
&&CQ: 二维数组不行呀博主，只能解决一维数组的这种问题
python机器学习包mlxtend的安装和配置
独往北陌: 请问包mlxtend的安装具体要加上哪几行代码啊？我小小小白真的看了文章也看不到啊
Pytorch 读取参数错误 RuntimeError: cuda runtime error (10) : invalid device ordinal
从火星学到地球: 博主您好。我是台式电脑，只有一张显卡，我改成了gpu0 但是还是报错 File "main.py", line 31, in <module> p = Processor(sys.argv[2:]) File "E:\Project\code\ST-GCN\processor\processor.py", line 29, in __init__ self.init_environment() File "E:\Project\code\ST-GCN\processor\processor.py", line 38, in init_environment super().init_environment() File "E:\Project\code\ST-GCN\processor\my_io.py", line 61, in init_environment torchlight.occupy_gpu(gpus) File "E:\ANAinstall\lib\site-packages\torchlight-1.0-py3.7.egg\torchlight\gpu.py", line 35, in occupy_gpu RuntimeError: CUDA error: invalid device ordinal [code=python] # gpu if self.arg.use_gpu: gpus = torchlight.visible_gpu(self.arg.device) torchlight.occupy_gpu(gpus) self.gpus = gpus self.dev = "cuda:0" else: self.dev = "cpu" [/code][code=python] [/code]
Pytorch 读取参数错误 RuntimeError: cuda runtime error (10) : invalid device ordinal
爱吃黑豆的白兔子: 您好，我现在也是遇到这个问题。我查看了serialization.py文件后发现有这句话，但是我不知道怎么改才能解决这个问题呢？麻烦您告知呢
LSTM模型理论总结（产生、发展和性能等）
织网者Eric: 李菲菲是谁？我只认识李飞飞

最新文章

目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。