强化学习第2课：强化学习，监督式学习，非监督式学习的区别

最新推荐文章于 2024-06-14 13:55:13 发布

Alice熹爱学习

最新推荐文章于 2024-06-14 13:55:13 发布

阅读量2.4k

点赞数

分类专栏：强化学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/aliceyangxi1987/article/details/84403383

版权

本文对比了强化学习、监督学习和非监督学习的区别。在监督学习中，目标是使预测接近标签，依赖独立数据样本。而强化学习没有预定义标签，通过尝试行动获取正负反馈，需要全面探索行为空间。非监督学习则关注数据的内在结构。尽管有所不同，实际应用中三种方法可能会结合使用。

摘要由CSDN通过智能技术生成

现在让我们看一下强化学习和其他机器学习方法的对比。

在监督式学习中，我们有数据集，还有数据对应的标签。主要的任务是要让预测值尽量接近于这些标签。

监督学习还有一个很重要的特点，就是它的数据要满足独立性。这对于使用SGD等算法，需要对数据进行采样时非常重要。

而在强化学习中却没有这些假设条件：
我们没有数据集，但是我们有一个系统，可以从中取样数据。
我们也没有想要得到的结果标签，因为没有专家告诉我们要做什么。

不过我们可以自己尝试，通过采取一些行动，会有一个评判标准给我们正面或者负面的反馈。
例如在广告点击率这个问题中，我们得到的反馈就可以是用户点击网页后我们得到的钱。

最低0.47元/天解锁文章

Alice熹爱学习

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
强化学习第2课：强化学习，监督式学习，非监督式学习的区别

图片来源现在让我们看一下强化学习和其他机器学习方法的对比。在监督式学习中，我们有数据集，还有数据对应的标签。主要的任务是要让预测值尽量接近于这些标签。监督学习还有一个很重要的特点，就是它的数据要满足独立性。这对于使用SGD等算法，需要对数据进行采样时非常重要。而在强化学习中却没有这些假设条件：我们没有数据集，但是我们有一个系统，可以从中取样数据。我们也没有想要得到的结果标签，因为没...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。