李洪义机器学习课程(一)——Learning Map学习笔记

  我们先一张一张PPT来分析讲解[1]。

总体框图


这里写图片描述
这张图表明了接下来的知识脉络体系,也可以看成目前学术界、工业界的几大研究方向。整体上分为:
监督学习、半监督学习、无监督学习、迁移学习、强化学习。
对于监督学习又分为:回归、分类、结构化学习[2]
对于分类问题,整体上分为线性模型和非线性模型,非线性模型包括深度学习、SVM、决策树、KNN等。
接下来一个一个说明。
 李大大对回归有一个例子说明:
回归举例
该图是一个预测PM2.5的回归问题,由今天上午PM2.5的数值和昨天上午的PM2.5的数值等输入数据预测明天上午PM2.5的数值。输入输出数据分别如下:
这里写图片描述
接下来,李大大谈到分类问题,

分类问题

分类
 分类分为二分类和多分类问题。
分类问题
二分类问题李大大举个例子,邮箱是否具有某个功能,多分类例子比如新闻分类问题。
二分类问题
多分类问题
既然是分类问题,那我们用什么方法学习呢,首先想到的是线性模型,然而线性模型因为其模型过于简单、特征工程量大等特性不会简简单单的一个模型使用。其次就是非线性模型了,非线性模型中深度学习越来越热,也扮演着重要的角色。
非线性模型深度学习
深度学习用于分类问题在很多方面已经成熟应用。比如,图像识别,输入是一张未知动物的图片,经过一个函数(for example,CNN,这个函数相当于model,该model的训练数据是一堆已经标记好猴子、猫、狗的标签数据)的判断出该张图片属于哪一个类别的动物。
图像识别
比如,判断一盘围棋接下来落子该如何走。输入是一盘围棋,经过一个函数(model的训练数据是一堆棋谱)判断接下来一步该走到哪一个位置,每一位置可以看成一个类别。多分类问题。

半监督学习

  半监督学习
  半监督学习李大大说了,就像这样的:
  半监督学习举例
在辨别猫和狗的例子中,有一部分是标注好的标签数据,一部分是非标签数据。那么Semi-supervised
Learning做的就是利用Unlabeled data优化function,也常用于数据不足时进行学习[3]。

迁移学习

这里写图片描述
迁移学习,顾名思义,是在迁移中学习。这个是指模型具有可迁移性从而可以节省模型训练时间。比如:
迁移学习举例
上个例子说,输入数据中的一部分标注好label的cat和dog和另一部分与猫狗无关的一些图片(比如,大象啊,狮子啊,还有凉宫春日有木有~可以标注好label,也可以是没标注的~)。那么Transfer Learning就是利用这些data优化function[3][4]。

无监督学习

比如,机器阅读,

机器阅读
机器阅读是这个样子的,给机器一丢丢材料,然后喂给机器一个”Apple”的词语让机器学习出这个词是个啥东西。
机器阅读举例
另一个是机器画画,训练数据是一丢丢图片,然后给到一串code,生成一幅图片(例子里是咖啡)。
机器画图

结构化学习

此类问题在实际运用中,常常会遇到Beyond Classification的情况,比如语音识别,人脸识别,语言翻译等,是结构化输出。此类问题常配合Reinforcement Learning 解决。(这是为啥,黑人问号,求解答——博主理解为强化学习是调整策略以达到最佳效果,语音识别一类问题无法通过分类问题有效解决,依靠策略性靠近实现)
除分类以外的结构化学习问题
 
接下来就是最后一类学习了,强化学习。

强化学习

监督学习 vs 强化学习
举例1、用一个语音识别的例子来解释:
Supervised 就像给了机器一个点读机,他听到一句话时可以看到其含义,每一句话都有标签,就像有一个手把手教他的老师。而Reinforcement Learning 就像跟女朋友对话,反复讲来回讲很多句话,直到女朋友觉得你无言以对愤然离去,机器唯一可以知道的就是他做的好还是不好,除此之外没有任何information。而这更像人类现实生活中的学习过程,必须自己像哪里做得好做得不够好,怎么修正。
语音识别
另一个例子,下围棋。
举例2:
supervised: 给机器一堆棋谱,告诉机器,情况a则落子在“5-5”处,情况b则落子在……
Reinforcement Learning: 让机器自己下棋,下过几百手之后,机器只知道自己赢了还是输了,下的好还是不好,机器必须自己想办法做提高。
下围棋
换句话说,我们可以这么来理解,监督学习是在对于有标签的数据进行训练并对未知数据进行预测,对于强化学习是在某一个环境中依靠某一个策略逐步修正的过程。
最后来一个总结:
总结
以下截图总结来源于[3]:
蓝色部分代表scenario,意思是你现在有什么类型的 training data。
这里写图片描述
红色部分代表task,意思是现在function的output是什么,只体现在supervised中,但其实可以插在以上五种Learning的每一种内。
这里写图片描述
绿色部分代表Method方法模型,比如在Classification中有Linear模型 or Non-linear模型,我们可以将绿色部分插入任何红色部分中。即在监督学习中都可以用到线性和非线性模型。
Ref:
1、http://101.96.10.64/speech.ee.ntu.edu.tw/~tlkagk/courses/ML_2016/Lecture/Learning%20Map%20%28v2%29.pdf
2、https://blog.csdn.net/qq_32690999/article/details/78840312
3、https://blog.csdn.net/soulmeetliang/article/details/72591054
4、http://cs231n.github.io/transfer-learning/

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值