[机器学习入门] 李宏毅机器学习笔记-1(Learning Map 课程导览图)

机器学习 同时被 2 个专栏收录
56 篇文章 1 订阅
41 篇文章 71 订阅

在此就不介绍机器学习的概念了。

Learning Map(学习导图)

PDFVIDEO

先来看一张李大大的总图↓

先来看一张李大大的总图

鉴于看起来不是很直观,我“照虎画猫”做了一个思维导图如下:

这里写图片描述

理论上Supervised Learning分支下的内容都可以放在其他Learning Map大类下。


1. Supervised Learning

所谓监督学习,就是我们告诉机器说,当这个function看到某种input则输出a,看到另一种input输出b,看到……

Supervised Learning-> Regression

Regresion: The output of the target founction f is ‘scalar’.
如果我们在机器学习中要找的function输出是数值,

举个例子: 预测PM2.5进行天气预报。

这里写图片描述

核心思想就是:连续函数下进行预测

Supervised Learning-> Classification

分类问题有两种可能,Binary Classification 输出是或否,Multi-class
Classification输出多个类型。

这里写图片描述

举个例子:

Binary Classification: Spam filtering(垃圾邮件过滤),判断是垃圾邮件,不是垃圾邮件。

Multi-classification: Document
Classification(文件分类),将文件分为政治、经济、体育等多个大类。


Classification-> Linear Model 与 Non-Linear Model

Linear Model : 能做的事有限,一些简单的模型可以用它来做,但遇到复杂问题就力不从心了。

Non-linear Model : For example,现在的深度学习就是一个Non-linear Model,能完成一些很复杂的工作,比如图像分类等。

  • Classification-Image Recognition:输入一个图片,通过一个很复杂的卷积神经网络(CNN)的Function判断是猫是狗还是猴子,每个可能的物种是class。

    这里写图片描述

  • Classification-Playing Go:输入棋盘上的局势,判断下一个落子的位置,每一个可能的落子位置就是一个class。

    这里写图片描述


Structuerd Learning

在实际运用中,常常会遇到Beyond
Classification的情况,比如语音识别,人脸识别,语言翻译等,是结构化输出。此类问题常配合Reinforcement
Learning 解决。

这里写图片描述


2. Semi-supervised Learning

example:要建立一个辨识猫与狗的系统,手上有一部分Labelled
data(已经标记好的猫狗图片),和一部分Unlabeled data(未做过标记的猫狗图片),那么Semi-supervised
Learning做的就是利用Unlabeled data优化function,也常用于数据不足时进行学习。


3. Transfer Learning

example:还是建立辨识猫与狗的系统,手上有一部分Labelled data(已经标记好的猫狗图片),和另一部分与猫狗没有关系的图片(比如狮子老虎,标未标记都可),那么Transfer
Learning就是利用这些data优化function。

这里写图片描述

4. Unsupervised Learning

example1: 要让机器学会阅读,希望机器自己在网络上爬去很多文章,自己理解其中的意思,进而取得人类的一些理解,掌握阅读的技巧,这就是非监督学习要做的。

我们知道,做machine
Learning就是要找一个function。比如在学会阅读这个系统里,我们给系统input一个“apple”词汇,然后让机器看懂。在Unsupervised
Learning 中没有人告诉机器每个词汇表示什么意思,只有大量text喂给机器。

这里写图片描述

example2:要让机器学会自主绘画,我们只给机器呈现显示世界中的景象并不做标识,机器要从中提炼绘画风格与内容,学会通过作画表达自己。

这里写图片描述

4. Reinforcement Learning

在实际运用中,以上方法并不能解决全部问题,常常会遇到Beyond
Classification的情况,比如语音识别,人脸识别,语言翻译等,那么就要通过增强学习来解决问题。

增强学习的一个非常知名的应用就是 google 阿法狗。


Reinforcement Learning VS Supervised

增强学习与监督学习有什么区别呢?
example1:用一个语音识别的例子来解释:

Supervised 就像给了机器一个点读机,他听到一句话时可以看到其含义,每一句话都有标签,就像有一个手把手教他的老师

而Reinforcement Learning
就像跟女朋友对话,反复讲来回讲很多句话,直到女朋友觉得你无言以对愤然离去,机器唯一可以知道的就是他做的好还是不好,除此之外没有任何information。而这更像人类现实生活中的学习过程,必须自己像哪里做得好做得不够好,怎么修正。

这里写图片描述

另一个例子,下围棋。

example2:

supervised: 给机器一堆棋谱,告诉机器,情况a则落子在“5-5”处,情况b则落子在……

Reinforcement Learning:
让机器自己下棋,下过几百手之后,机器只知道自己赢了还是输了,下的好还是不好,机器必须自己想办法做提高。

这里写图片描述

Alpha Go is supervised learning + reinforcement learning.


学习导图总结

有一个非常重要的信息是每一个框的颜色。

这里写图片描述


  • 蓝色部分代表scenario,意思是你现在有什么类型的 training data。
machine learningscenario
Supervised Learning有标签data
Semi-supervised Learning部分有标签data
Unsupervised Learning无标签data
Transfer Learning一堆不相干data
Reinforcement Learning只有来自外界的评价

  • 红色部分代表task,意思是现在function的output是什么,只体现在supervised中,但其实可以插在以上五种Learning的每一种内。
machine learningtask(output)
Regressionscalar
Classificationclass1、class2…之一
Structured Learning有结构的内容

  • 绿色部分代表Method方法模型,比如在Classification中有Linear模型 or Non-linear模型,我们可以将绿色部分插入任何红色部分中。
相关推荐
©️2020 CSDN 皮肤主题: 大白 设计师:CSDN官方博客 返回首页
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值