![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
强化学习
MezereonXP
A developer ,love life, love saber
展开
-
强化学习笔记(1)
基于Simple statistical gradient-following algorithms for connectionist reinforcement learning 0. 概述 该文章提出了一个关于联合强化学习算法的广泛的类别, 针对包含随机单元的有连接的网络, 这些算法, 称之为强化算法, 看上去像是沿着某个方向对权重进行调整, 依赖于期望强化的梯度, 比如在即时强化的任务中和...原创 2018-10-20 17:38:23 · 1388 阅读 · 0 评论 -
强化学习笔记(2)
根据 Simple statistical gradient-following algorithms for connectionist reinforcement learning 承接上一篇笔记(强化学习笔记(1)) 5. 段落式(Episodic)的REINFORCE算法 该部分主要是将我们已有的算法进行扩展, 扩展到拥有temporal credit-assignment compone...原创 2018-10-20 22:35:32 · 418 阅读 · 0 评论