目录
(2)(Semi-supervised Learning)半监督学习:
(4)(Unsupervised Learning)无监督学习:
(5)(Reinforcement Learning)强化学习:
前篇:
需要掌握的数学知识:
01- 线性代数:
矩阵:(单位矩阵,方阵,。。。)
-
加减乘除,(矩阵x矩阵):m · x 与 x · n 要求;除法什么玩意没印象;
-
运算法则,
-
矩阵转置,
-
逆矩阵,
02- 高等数学:
-
导数
-
偏导数(多维函数)
-
方向导数和梯度:方向导数:方向变化率(出坐标轴外),梯度:在空间某一点,那个方向有最大的变化率;(grad f(x 0,x 1,...)是一个向量)
-
凸函数凹函数
03- 概率统计:
-
常用统计变量
-
样本均值:E( X )
-
样本方差 : D( x ) = S^2;
-
标准差
-
-
常见概率分布
-
均匀分布
-
正态分布(Gauss)
-
指数分布
-
-
重要概率公式
-
条件概率公式
-
全概率公式:多种情况之和(依赖于条件概率喔)
-
贝叶斯公式:分子-乘法公式(条件概率),分母-全概率公式
-
-
1- Learning Map 知识脉络体系。
整体上,分为:
(1)(Supervised Learning)监督学习:
【1】Regression(回归学习):
//regression Pm2.5 的回归案例, 根据昨天,前天等的上午,下午数据,预测,明天上午,下午,的数据。
【2】Classification(分类学习):
-
典型应用,图像识别。
-
判断一盘围棋接下来该如何走,训练数据为一堆棋谱,每一个接下来该走的位置可看作,一个类别,多酚类问题。
大致分为两类: 二分类(Binary classification) e.g.: 邮箱具有某个功能 多分类(Multi-class Classification) e.g.: 新闻分类
-
Linear Model:
-
No Linear Model:
-
DeepLearning
-
SVM,decision,tree,k-NN。。。
-
【3】Structerd Learning(结构化学习):
-
常常包括,语音识别,人脸识别,语言翻译等,常常会遇到Beyond classification 的情况,此时,一般会配合,Reinforced learning强化学习来解决。
(2)(Semi-supervised Learning)半监督学习:
-
e.g.:辨别cat 和 dog的事例中:有两组标签数据进行学习,一部分是标注好的(注明有是cat还是dog),另一部分是 未标注的;
-
而,半监督学习(semi-supervised learning)做的就是利用,unlabeled data非标签数据,进行优化function,也常用于数据不足的时候,进行学习。
(3)( Transfer Learning)迁移学习:
在,半监督学习之上,将未标注的学习数据替换为(除了猫cat和狗dog的其他图片,大象,狮子,人物等)【其可以标注也可以不标注】,TransferLearning即利用其data优化function。
(4)(Unsupervised Learning)无监督学习:
-
机器阅读
//给机器一些材料,再给机器一个单词“apple”,让机器学习,这个单词是什么意思。
-
机器画面
//训练数据是给一些图片,然后再给一串code,生成一副图片(咖啡或者等等...)
(5)(Reinforcement Learning)强化学习:
监督学习和强化学习的一些些区别差异:
-
supervisedLearning:像给机器一个点读机,像手把手教的老师。
-
围棋,给棋谱
-
-
reinforcementLearning:更像是和女朋友反复对话,...。
-
围棋,让机器,自己,下,下过几百手之后,机器只知道是赢了还是输了,好与不好,机器必须自己想办法提高。
-
/* 监督学习 vs 强化学习 举例1、用一个语音识别的例子来解释: Supervised 就像给了机器一个点读机,他听到一句话时可以看到其含义,每一句话都有标签,就像有一个手把手教他的老师。而Reinforcement Learning 就像跟女朋友对话,反复讲来回讲很多句话,直到女朋友觉得你无言以对愤然离去,机器唯一可以知道的就是他做的好还是不好,除此之外没有任何information。而这更像人类现实生活中的学习过程,必须自己像哪里做得好做得不够好,怎么修正。 */
总的来说:
-
supervised Learning:是在对于有标签的数据进行训练,并对未知的数据进行预测。
-
Reinforced Learning:是在某一个环境中,依靠某一个策略,逐步进行修正的过程。
Machine Learning | scenario(方案) |
---|---|
Supervised Learning | 有标签data |
Semi-supervised Learning | 部分有标签data |
Unsupervised Learning | 无标签data |
Transfer Learning | 一大堆不相干data |
Reinforsement Learning | 只有来自外界的评价 |