机器学习中强化学习与监督学习、无监督学习区别

监督学习(Supervised learning):

监督学习即具有特征(feature)和标签(label)的,即使数据是没有标签的,也可以通过学习特征和标签之间的关系,判断出标签——分类。

简言之:提供数据,预测标签。比如对动物猫和狗的图片进行预测,预测label为cat或者dog。

通过已有的一部分输入数据与输出数据之间的对应关系,生成一个函数,将输入映射到合适的输出,例如分类。

无监督学习(Unsupervised learning):

无监督学习即只有特征,没有标签,只有特征,没有标签的训练数据集中,通过数据之间的内在联系和相似性将他们分成若干类——聚类。

简言之:给出数据,寻找隐藏的关系。

半监督学习(Semi-Supervised learning):

半监督学习使用的数据,一部分是标记过的,而大部分是没有标记的,和监督学习相比较,半监督学习的成本较低,但是又能达到较高的准确度,即综合利用有类标的和没有类标的数据,来生成合适的分类函数。

简言之:少部分标记,大部分未知

强化学习(Reinforcement learning):

强化学习与半监督学习类似,均使用未标记的数据,但是强化学习通过算法学习是否距离目标越来越近,我理解为激励与惩罚函数。类似生活中,女朋友不断调教直男友变成暖男。

简言之:通过不断激励与惩罚,达到最终目的。

区别:

监督学习有反馈,无监督学习无反馈,强化学习是执行多步之后才反馈。

转载于:https://www.cnblogs.com/wzw0625/p/ML.html

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值