白话文学强化学习-1

最新推荐文章于 2023-09-03 08:28:41 发布

开心1002

最新推荐文章于 2023-09-03 08:28:41 发布

阅读量535

点赞数

分类专栏：强化学习文章标签：白话文强化学习

本文链接：https://blog.csdn.net/MyEclipse_1214/article/details/84146909

版权

强化学习介绍

强化学习(reinforcement learning)，又称再励学习、评价学习，是一种重要的机器学习方法，在智能控制机器人及分析预测等领域有许多应用。

强化学习用人话来解释的话，假设CV（计算机视觉）和NLP（自然语言处理）是教会计算机如何看和听这个世界的话，那RL（强化学习）则是教会计算机如何思考这个世界了。这里要拿出被举的最多的例子了：

巴甫洛夫的狗

强化学习的过程和训狗很像的，没有训练过的狗狗是不会听到训犬师说坐下就理解并马上坐下的，所以需要一个训练的过程：通常是训犬师发出坐下的命令，然后可能狗狗会随便做一些动作也可以是在训犬师帮助下它完成坐下的动作，并且在狗狗完成后坐下的动作后给予奖励，比如喂点狗狗的零食什么的，并且不断重复这个过程，狗狗做对了就给奖励，没做对什么也不给（或者可以给点小小的惩罚）。出于对食物零食的渴望，狗狗慢慢就学习到了训犬师说出坐下的命令和自己坐下以及得到食物的奖励这三者的关系，时间久了狗狗也就会听从训犬师的坐下命令了。不单单是坐下的命令，其他的动作也可以用这种奖励惩罚的规则进行训练，但是不要殴打我们可爱的狗狗哦～

经典的S、A、R

学习强化学习是离不开这3个字母的，分别是State状态或者环境，Action动作，Reward奖励。对于上面的训狗例子这3个分别对应：S 训犬师的指令，A 狗狗选择的动作， R 奖励或者惩罚。
所以流程是这样的，首先由训犬师给出当前的S（指令&#x

最低0.47元/天解锁文章

开心1002

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
白话文学强化学习-1

强化学习介绍强化学习(reinforcement learning)，又称再励学习、评价学习，是一种重要的机器学习方法，在智能控制机器人及分析预测等领域有许多应用。强化学习用人话来解释的话，假设CV（计算机视觉）和NLP（自然语言处理）是教会计算机如何看和听这个世界的话，那RL（强化学习）则是教会计算机如何思考这个世界了。这里要拿出被举的最多的例子了：巴甫洛夫的狗强化学习的过程和训狗很像...
复制链接

扫一扫