李洪义机器学习课程（一）——Learning Map学习笔记

最新推荐文章于 2022-09-06 16:41:41 发布

代码随想随记

最新推荐文章于 2022-09-06 16:41:41 发布

阅读量628

点赞数

分类专栏： python 机器学习文章标签：机器学习课程笔记

本文链接：https://blog.csdn.net/woai8339/article/details/82316407

版权

python 同时被 2 个专栏收录

74 篇文章 5 订阅

订阅专栏

机器学习

25 篇文章 0 订阅

订阅专栏

　　我们先一张一张PPT来分析讲解[1]。

总体框图

：
这里写图片描述
这张图表明了接下来的知识脉络体系，也可以看成目前学术界、工业界的几大研究方向。整体上分为：
监督学习、半监督学习、无监督学习、迁移学习、强化学习。
对于监督学习又分为：回归、分类、结构化学习[2]
对于分类问题，整体上分为线性模型和非线性模型，非线性模型包括深度学习、SVM、决策树、KNN等。
接下来一个一个说明。
　李大大对回归有一个例子说明：
回归举例
该图是一个预测PM2.5的回归问题，由今天上午PM2.5的数值和昨天上午的PM2.5的数值等输入数据预测明天上午PM2.5的数值。输入输出数据分别如下：
这里写图片描述
接下来，李大大谈到分类问题，

分类问题

　分类分为二分类和多分类问题。

二分类问题李大大举个例子，邮箱是否具有某个功能，多分类例子比如新闻分类问题。

既然是分类问题，那我们用什么方法学习呢，首先想到的是线性模型，然而线性模型因为其模型过于简单、特征工程量大等特性不会简简单单的一个模型使用。其次就是非线性模型了，非线性模型中深度学习越来越热，也扮演着重要的角色。
非线性模型深度学习
深度学习用于分类问题在很多方面已经成熟应用。比如，图像识别，输入是一张未知动物的图片，经过一个函数(for example,CNN,这个函数相当于model，该model的训练数据是一堆已经标记好猴子、猫、狗的标签数据)的判断出该张图片属于哪一个类别的动物。

比如，判断一盘围棋接下来落子该如何走。输入是一盘围棋，经过一个函数（model的训练数据是一堆棋谱）判断接下来一步该走到哪一个位置，每一位置可以看成一个类别。多分类问题。

半监督学习

　　
　　半监督学习李大大说了，就像这样的：
　　半监督学习举例
在辨别猫和狗的例子中，有一部分是标注好的标签数据，一部分是非标签数据。那么Semi-supervised
Learning做的就是利用Unlabeled data优化function，也常用于数据不足时进行学习[3]。

迁移学习

这里写图片描述
迁移学习，顾名思义，是在迁移中学习。这个是指模型具有可迁移性从而可以节省模型训练时间。比如：
迁移学习举例
上个例子说，输入数据中的一部分标注好label的cat和dog和另一部分与猫狗无关的一些图片（比如，大象啊，狮子啊，还有凉宫春日有木有～可以标注好label，也可以是没标注的～）。那么Transfer Learning就是利用这些data优化function[3][4]。

无监督学习

比如，机器阅读，

机器阅读是这个样子的，给机器一丢丢材料，然后喂给机器一个”Apple”的词语让机器学习出这个词是个啥东西。
机器阅读举例
另一个是机器画画，训练数据是一丢丢图片，然后给到一串code，生成一幅图片（例子里是咖啡）。
机器画图

结构化学习

此类问题在实际运用中，常常会遇到Beyond Classification的情况，比如语音识别，人脸识别，语言翻译等，是结构化输出。此类问题常配合Reinforcement Learning 解决。（这是为啥，黑人问号，求解答——博主理解为强化学习是调整策略以达到最佳效果，语音识别一类问题无法通过分类问题有效解决，依靠策略性靠近实现）
除分类以外的结构化学习问题
　
接下来就是最后一类学习了，强化学习。

强化学习

监督学习 vs 强化学习
举例１、用一个语音识别的例子来解释：
Supervised 就像给了机器一个点读机，他听到一句话时可以看到其含义，每一句话都有标签，就像有一个手把手教他的老师。而Reinforcement Learning 就像跟女朋友对话，反复讲来回讲很多句话，直到女朋友觉得你无言以对愤然离去，机器唯一可以知道的就是他做的好还是不好，除此之外没有任何information。而这更像人类现实生活中的学习过程，必须自己像哪里做得好做得不够好，怎么修正。
语音识别
另一个例子，下围棋。
举例2：
supervised：给机器一堆棋谱，告诉机器，情况a则落子在“5-5”处，情况b则落子在……
Reinforcement Learning: 让机器自己下棋，下过几百手之后，机器只知道自己赢了还是输了，下的好还是不好，机器必须自己想办法做提高。
下围棋
换句话说，我们可以这么来理解，监督学习是在对于有标签的数据进行训练并对未知数据进行预测，对于强化学习是在某一个环境中依靠某一个策略逐步修正的过程。
最后来一个总结：

以下截图总结来源于[3]:
蓝色部分代表scenario，意思是你现在有什么类型的 training data。
这里写图片描述
红色部分代表task，意思是现在function的output是什么，只体现在supervised中，但其实可以插在以上五种Learning的每一种内。

绿色部分代表Method方法模型，比如在Classification中有Linear模型 or Non-linear模型，我们可以将绿色部分插入任何红色部分中。即在监督学习中都可以用到线性和非线性模型。
Ref:
1、http://101.96.10.64/speech.ee.ntu.edu.tw/~tlkagk/courses/ML_2016/Lecture/Learning%20Map%20%28v2%29.pdf
2、https://blog.csdn.net/qq_32690999/article/details/78840312
3、https://blog.csdn.net/soulmeetliang/article/details/72591054
4、http://cs231n.github.io/transfer-learning/