自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

CaiXinQiWorld的博客

强化学习

关注

关注数：文章数：1 文章阅读量：2323 文章收藏量：3

作者: 飘逸慕嫣然

欢迎交流，共同进步！编程中最没用的东西是源代码，最有用的东西是算法和数据结构。

展开

神经情景控制（Neural Episodic Control）On arXiv By DeepMind

在诸多领域，深度强化学习的表现已经超越人类。但是这种学习方式效率非常低，与人类相比要达到满意表现所需的数据量要高好几个数量级。为此我们提出了神经情景控制：一种能够快速吸收新经验并依据新经验来采取行动的智能体。该智能体的价值函数采用半值方式表示：一种旧经验缓冲器，包括价值函数渐变状态表示和价值函数快速更新估计两部分。在大量场景下的研究表明，该智能体的学习速度明显快于目前最先进的通用深度强化学习智能体。

翻译 2017-06-19 11:58:49 · 2323 阅读 · 0 评论