1. 引言
大部分的机器学习入门课当中,一开始也最基础的观念就是机器学习的三类方式,它们分别是监督式学习(Supervised learning)
、非监督式学习(Unsupervised learning)
与强化式学习(Reinforcement learning)
。很多同学对这三个名字都有些陌生。 这边我尝试用家长教育孩子的方式来解释他们的概念,如果有任何疏漏之处,欢迎大家多多指教。
2. 机器学习到底机器是在学什么
从字面上来看,机器学习
就是让机器(电脑)学习一件事情,就和我们一样,从小到大,我们深受父母、教师或朋友等影响,形成了现在的我们。机器学习也是一样,让我们假设今天电脑是你的小孩,你可以选择采用哪种教育方针教导它,使它未来能得到你预期的结果。
3. 监督式学习
我们首先来介绍我们的大儿子–监督式学习。它的个性单纯、踏实,大部分的事情我们必须先跟它解释够多遍,它才有足够的判断力做出相应的决定。
举例来说,我们今天带着它来到公园,为了让他了解什么是植物,你指向榕树、矮树林、灌木丛与草地,看!这些都是植物,接着指着天空、汽车和房子说这些不是植物,带着它认识大部分的物件后,大儿子最终找到了规律(绿色、有根或叶),学会了如何判断什么是植物。
所以,监督式学习必须要在数据有标记(labeled)的状况下使用,在现实例子中,针对大型电商,他们手上可能有一份记录着顾客月收入、年龄、性别等标记的数据清单,将这份数据喂给电脑处理,便可让电脑从中根据指标来判断下一个使用者出现时,会购买商品的机率是多少。
4. 非监督式学习
接着我们来介绍我们的第二个孩子–非监督式学习。它喜欢将看到的物件依照结构分门别类、划分成不同群组,当我们将一箱动物玩具放在它面前时,它很快就能够从中分出不同的小圈子,往往让人感到惊讶的是,我们事先并没有告诉它每只动物是属于哪种类别,它却可以透过观察将其分成有翅膀能够飞的、能在水中生活的或只能在路上爬的动物,有些甚至有它独特的分类方法是我们没有预想到的,这就是非监督式学习。我们不必透过监督,就可以从玩具中透过观察解析结构将数据做好分类。
非监督式学习只需要无标记(unlabeled)的数据,便能正常工作。换成现实中的例子,想到的是消费者喜好分析,一般在分类不同消费群组时,我们习惯根据性别、年纪等做分组,但假如今天我们观察发现有个会员会在白天购买化妆品、傍晚购买啤酒、晚上买电动,而且这个种群的数量还不算少,若只看性别和年纪应该会满头雾水,觉得这个消费者是不是得了精神分裂症。而这组会员其实就是家庭,全家爸爸、妈妈、小孩共享同一个帐号进行网购的现象,若套用非监督式学习去分析消费者的行为,便有机会筛检出这些具有相同消费属性的群体。
5. 强化学习
最后我们最小的女儿–强化学习。她最喜欢下棋,常常要求我们跟它对弈,一开始我们一定会窃笑它的思路缺乏常识,总是下险棋犯些很明显的错误,但经过一局又一局的对弈之后,它不断思考每一局的过错是不是有改变的可能,所以它越下越好,思考的套路也更加深层,没错!AlphaGo就是强化式学习的一种应用。
更近一步,强化式学习的特征是训练必须要有正负回报·(positive/negative reward)
,在训练过程中,模型会根据不同的状况(state)
尝试各种决定(action)
,再根据此决定得到的结果进行学习改进。
6. 结论
最后我们对本文做个简单的总结:
- 监督式学习:数据已有标记,运用已标记数据来做训练。
- 非监督式学习:数据没有标记,从中找出拥有相同特征的数据群。
- 强化式学习:可能手上没有任何数据,直接让模型执行,再将执行结果反馈回去做训练。
恩恩,您学废了吗?