公开课 | 机器学习基石03 Types of Learning


?wx_fmt=jpeg 写在前面本篇从输出空间、数据标签、协议、输入空间四个角度介绍各式各样的机器学习方法。


1 按照输出空间(Output Space)分类


按照Output Space可以分为:

  1. 二分类(binary classification):y={+1, -1}。比如:answer correct/incorrect。

  2. 多分类(multiclass classification):y={1, 2, ..., K}。比如:written digits ⇒ 0,1,··· ,9。

  3. 回归(regression):y=R。比如:company data ⇒ stock price。

  4. 结构学习(structured learning):y=structures。比如:sentence => structure(class of each word),y={PVN, PVP, NVP, PV, ...};speech data => speech parse tree。

其中,分类和回归是基本问题。


2 按照数据标签(Data Label)分类

按照数据标签,可以分为:

 

1. 监督学习(supervised learning):全部是标注数据。如下图所示。

?wx_fmt=png

 

2. 无监督学习(unsupervised learning):数据集全部未标注。如下图所示。

?wx_fmt=png

 

3. 半监督学习(semi-supervised learning):数据集标注少量数据。如下图所示。

?wx_fmt=png

 

4. 增强学习(reinforcement learning):一种更加自然的学习方式。不直接告诉什么是正确的,而是通过惩罚不好的结果,奖励好的结果来增强学习的效果。通常用于广告系统中。如下图所示。

?wx_fmt=png

 

总结:

?wx_fmt=png



3 按照协议(Protocol)分类

按照协议,可以分为:

1. 批量学习(batch learning)最常用的一种协议。

例如:

        batch of (patient, cancer) ⇒ cancer classifier

        batch of patient data ⇒ group of patients 

 

2. 在线学习(online learning)。有序地接受训练数据来学习。比如:垃圾邮件分类。PLA 很容易作为一种在线学习协议。

?wx_fmt=png

 

3. 主动学习(active learning)。只有少量标记的数据,通过有策略地(strategically)主动问问题方式来学习。

?wx_fmt=png

 

总结:

?wx_fmt=png



4 按照输入空间(Input Space)分类


按照输入空间,可以分为:

    1. 具体特征(concrete features)。例如:(size, mass) => coin classification。

    2. 原始数据(raw features)。例如:16x16 gray image x≡ (0,0,0.9,0.6,···) ∈ R256  => 数字识别。

    3. 抽象特征(abstract features)。对原始数据进行特征转化和抽取。例如:电影评分原始数据 (userid, itemid, rating),需要训练 rating. 但是(userid, itemid) 本身没有意义,需要进一步抽取。


总结:

?wx_fmt=png



转自:机器学习小蜜蜂

阅读伙伴公众号更多精彩内容,点击 “ 阅读原文 ”

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值