Paper Reading 4:Massively Parallel Methods for Deep Reinforcement Learning

最新推荐文章于 2021-12-31 17:35:54 发布

VIP文章 songrotek

最新推荐文章于 2021-12-31 17:35:54 发布

阅读量3.7k

点赞数

分类专栏： Deep Reinforcement Learning 深度增强学习DRL 文章标签：深度增强学习 DRL 深度强化学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/songrotek/article/details/50920247

版权

来源：ICML 2015 Deep Learning Workshop

作者：Google DeepMind

创新点：构建第一个用于深度增强学习的大规模分布式结构

该结构由四部分组成：

并行的行动器：用于产生新的行为
并行的学习器：用于从存储的经验中训练
分布式的神经网络：用于表示value function或者policy
分布式的经验存储

实验结果：

将DQN应用在该体系结构上，训练的水平在49个游戏中有41个游戏超过没有分布式DQN的水平，并且减少了训练时间

优点：

训练效果更好
训练时间更短

缺点：

并行分布式主要缺点恐怕是能耗高，造价昂贵，门槛高了。一般人没办法搞这个

可改进之处：

主要需要改进的是算法层面。比如DQN一次只训练一个游戏，能不能同时训练多个同一个游戏来提升速度？

详细分析：

Introduction 介绍

再看这些介绍，就有点废话了：Deep Learning 在视觉和语音上取得了巨大的进展，归因于能够自动的提取高level的特征。当前增强学习成功地结合了深度学习的成果，也就是DQN，在Atari 游戏

最低0.47元/天解锁文章

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
Paper Reading 4:Massively Parallel Methods for Deep Reinforcement Learning

来源：ICML 2015 Deep Learning Workshop作者：Google DeepMind创新点：构建第一个用于深度增强学习的大规模分布式结构该结构由四部分组成：并行的行动器：用于产生新的行为并行的学习器：用于从存储的经验中训练分布式的神经网络：用于表示value function或者policy分布式的经验存储实验结果：将DQN应用在该体系结构上，训练的水平在49个游戏中
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。