强化学习
Agent1998
这个作者很懒,什么都没留下…
展开
-
强化学习论文推荐OpenAI
【导读】OpenAI 在教学资源合集 Spinning Up中发布了强化学习中的关键论文,列举了强化学习不同领域的代表性文章来指导研究者的学习。此外Spinning Up 包含清晰的 RL 代码示例、习题、文档和教程可供参考。 Model-Free RL Exploration Transfer and Multitask RL Hierarchy Memory Model-Based RL Meta-RL Scaling RL RL in the Real World转载 2020-05-24 16:20:05 · 916 阅读 · 0 评论 -
我的强化学习笔记(1)马尔可夫决策过程
我的强化学习代码仓库: https://github.com/ZiyiLiubird/MyRLcodes 首先,什么是强化学习?笔者的理解是,强化学习是一种半监督学习方式,系统与环境产生交互,做出一系列的行为,环境状态系统状态因此发生改变,环境最终给予系统一个反馈信号,也就是一个reward或punish。系统通过反馈信号来调整自己的行为,使其更加适应这个环境(接受更多的reward)。 强化学习的一个特点之一是,它每一次产生的行为不一定是当前最优的,但若算法收敛的情况下,将是一个全局最优解。每一步只选择当原创 2020-05-19 22:47:59 · 899 阅读 · 0 评论 -
我的强化学习笔记
为了准备Deecamp的面试,以及源于对自动驾驶的兴趣,笔者着手开始reinforcement learning的学习。写下笔记记录自己的学习过程。 首先,什么是强化学习?笔者的理解是,强化学习是一种半监督学习方式,系统与环境产生交互,做出一系列的行为,环境状态系统状态因此发生改变,环境最终给予系统一个反馈信号,也就是一个reward或punish。系统通过反馈信号来调整自己的行为,使其更加...原创 2019-05-11 16:05:40 · 539 阅读 · 0 评论