强化学习
文章平均质量分 92
喵一只电子喵
喜欢什么,分享什么
展开
-
【强化学习】Actor-Critic Methods
大家好呀,这里是喵一只电子喵~o( =∩ω∩= )m,今天学习actor-critic methods, 这是一篇学习笔记,(我感觉读学习笔记比视频更快)今天的学习视频是强化学习,老师吐字很清楚!!讲的也很清晰!!有关policy-based RL和value-based RL另一位大佬的博客里有写(我就是看他的哈哈哈写的很好!)好啦废话不多说,开始今天的学习吧!(#^.^#)原创 2024-08-02 19:59:04 · 1357 阅读 · 0 评论 -
【强化学习】Asynchronous Methods for Deep Reinforcement Learning论文笔记
本篇论文使用异步梯度下降优化深度神经网络控制器,主要提出了四种标准强化学习算法的异步变体:单步Q-learning,单步Sarsa, n步Q-learning和A3C。性能最好的方法是actor-critic的异步变体,在单多核CPU而不是GPU上训练一半时间的同时,超过了目前Atari领域的最先进技术。此外,我们还展示了A2C成功地解决了一系列连续的电机控制问题,以及使用视觉输入导航随机3D迷宫的新任务。原创 2024-08-08 10:57:37 · 2065 阅读 · 1 评论