强化学习（Reinforcement Learning）入门指南

最新推荐文章于 2024-05-27 10:11:45 发布

叫我小嘎子

最新推荐文章于 2024-05-27 10:11:45 发布

阅读量214

点赞数

分类专栏：强化学习文章标签：机器学习强化学习

本文链接：https://blog.csdn.net/qq946561354_xgl/article/details/106971075

版权

1 篇文章 0 订阅

订阅专栏

强化学习是机器学习大家族中的一大类, 使用强化学习能够让机器学着如何在环境中拿到高分, 表现出优秀的成绩. 而这些成绩背后却是他所付出的辛苦劳动, 不断的试错, 不断地尝试, 累积经验, 学习经验

监督学习需要大量的数据和其对应的正确标签，但是与强化学习来说它并没有数据和标签。
方法：通过一次次在环境中的尝试, 获取这些数据和标签, 然后再学习通过哪些数据能够对应哪些标签, 通过学习到的这些规律, 尽可能地选择带来高分的行为 .

其中基于表格学习的有Q learning，Sarsa;
使用神经网络的有Deep Q Network;
直接输出行为的有Policy Gradients；

=======================================================================
基于概率的强化学习

基于价值的强化学习：

结合两种，Actor-Critic,ACtor基于概率做出动作，而critic会对做出的动作给出动作的价值。

关注

专栏目录