机器学习中强化学习与监督学习、无监督学习区别

最新推荐文章于 2024-01-25 13:08:45 发布

baitongtong9417

最新推荐文章于 2024-01-25 13:08:45 发布

阅读量1.2k

点赞数

文章标签：人工智能

原文链接：http://www.cnblogs.com/wzw0625/p/ML.html

版权

监督学习（Supervised learning）：

监督学习即具有特征（feature）和标签（label）的，即使数据是没有标签的，也可以通过学习特征和标签之间的关系，判断出标签——分类。

简言之：提供数据，预测标签。比如对动物猫和狗的图片进行预测，预测label为cat或者dog。

通过已有的一部分输入数据与输出数据之间的对应关系，生成一个函数，将输入映射到合适的输出，例如分类。

无监督学习（Unsupervised learning）：

无监督学习即只有特征，没有标签，只有特征，没有标签的训练数据集中，通过数据之间的内在联系和相似性将他们分成若干类——聚类。

简言之：给出数据，寻找隐藏的关系。

半监督学习（Semi-Supervised learning）：

半监督学习使用的数据，一部分是标记过的，而大部分是没有标记的，和监督学习相比较，半监督学习的成本较低，但是又能达到较高的准确度，即综合利用有类标的和没有类标的数据，来生成合适的分类函数。

简言之：少部分标记，大部分未知

强化学习（Reinforcement learning）：

强化学习与半监督学习类似，均使用未标记的数据，但是强化学习通过算法学习是否距离目标越来越近，我理解为激励与惩罚函数。类似生活中，女朋友不断调教直男友变成暖男。

简言之：通过不断激励与惩罚，达到最终目的。

区别：

监督学习有反馈，无监督学习无反馈，强化学习是执行多步之后才反馈。

转载于:https://www.cnblogs.com/wzw0625/p/ML.html

baitongtong9417

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。