【科普】一文弄懂监督式学习、非监督式学习以及强化式学习

1. 引言

大部分的机器学习入门课当中,一开始也最基础的观念就是机器学习的三类方式,它们分别是监督式学习(Supervised learning)、非监督式学习(Unsupervised learning)与强化式学习(Reinforcement learning)。很多同学对这三个名字都有些陌生。 这边我尝试用家长教育孩子的方式来解释他们的概念,如果有任何疏漏之处,欢迎大家多多指教。

2. 机器学习到底机器是在学什么

从字面上来看,机器学习 就是让机器(电脑)学习一件事情,就和我们一样,从小到大,我们深受父母、教师或朋友等影响,形成了现在的我们。机器学习也是一样,让我们假设今天电脑是你的小孩,你可以选择采用哪种教育方针教导它,使它未来能得到你预期的结果。

3. 监督式学习

我们首先来介绍我们的大儿子–监督式学习。它的个性单纯、踏实,大部分的事情我们必须先跟它解释够多遍,它才有足够的判断力做出相应的决定。
举例来说,我们今天带着它来到公园,为了让他了解什么是植物,你指向榕树、矮树林、灌木丛与草地,看!这些都是植物,接着指着天空、汽车和房子说这些不是植物,带着它认识大部分的物件后,大儿子最终找到了规律(绿色、有根或叶),学会了如何判断什么是植物。

在这里插入图片描述

所以,监督式学习必须要在数据有标记(labeled)的状况下使用,在现实例子中,针对大型电商,他们手上可能有一份记录着顾客月收入、年龄、性别等标记的数据清单,将这份数据喂给电脑处理,便可让电脑从中根据指标来判断下一个使用者出现时,会购买商品的机率是多少。
在这里插入图片描述

4. 非监督式学习

接着我们来介绍我们的第二个孩子–非监督式学习。它喜欢将看到的物件依照结构分门别类、划分成不同群组,当我们将一箱动物玩具放在它面前时,它很快就能够从中分出不同的小圈子,往往让人感到惊讶的是,我们事先并没有告诉它每只动物是属于哪种类别,它却可以透过观察将其分成有翅膀能够飞的、能在水中生活的或只能在路上爬的动物,有些甚至有它独特的分类方法是我们没有预想到的,这就是非监督式学习。我们不必透过监督,就可以从玩具中透过观察解析结构将数据做好分类。

在这里插入图片描述
非监督式学习只需要无标记(unlabeled)的数据,便能正常工作。换成现实中的例子,想到的是消费者喜好分析,一般在分类不同消费群组时,我们习惯根据性别、年纪等做分组,但假如今天我们观察发现有个会员会在白天购买化妆品、傍晚购买啤酒、晚上买电动,而且这个种群的数量还不算少,若只看性别和年纪应该会满头雾水,觉得这个消费者是不是得了精神分裂症。而这组会员其实就是家庭,全家爸爸、妈妈、小孩共享同一个帐号进行网购的现象,若套用非监督式学习去分析消费者的行为,便有机会筛检出这些具有相同消费属性的群体。

5. 强化学习

最后我们最小的女儿–强化学习。她最喜欢下棋,常常要求我们跟它对弈,一开始我们一定会窃笑它的思路缺乏常识,总是下险棋犯些很明显的错误,但经过一局又一局的对弈之后,它不断思考每一局的过错是不是有改变的可能,所以它越下越好,思考的套路也更加深层,没错!AlphaGo就是强化式学习的一种应用。

在这里插入图片描述
更近一步,强化式学习的特征是训练必须要有正负回报·(positive/negative reward),在训练过程中,模型会根据不同的状况(state)尝试各种决定(action),再根据此决定得到的结果进行学习改进。

6. 结论

最后我们对本文做个简单的总结:

  • 监督式学习:数据已有标记,运用已标记数据来做训练。
  • 非监督式学习:数据没有标记,从中找出拥有相同特征的数据群。
  • 强化式学习:可能手上没有任何数据,直接让模型执行,再将执行结果反馈回去做训练。

恩恩,您学废了吗?
在这里插入图片描述

  • 8
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

赵卓不凡

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值