该系列文章是通过观看李宏毅机器学习视频所做的笔记。
一.机器学习介绍
目标:人工智慧(Artificial Intelligence)
手段:机器学习(Machine Learning)
深度学习是机器学习中的一种方法
Machine Learning≈Looking for a Function
eg:语音辨识中:找一个function,输入的是声音讯号,输出语言辨识的文字。
如何找到这个function呢?
以影像辨识为例,找个function输入一张图片,输出的是这个图片里面有什么样的东西。
因此Machine Learning Framwork分成三个步骤:
二.机器学习相关的技术
Learning Map如下图所示:
1.监督学习
监督学习需要大量的training data(有标签label的数据)
任务:Regression(回归):function的输出是Scaler(数值)
比如:预测未来某个时间的PM2.5
任务:Classification(分类):function的输出是类别
- Binary Classification(二元分类),输出yes or no
eg:鉴别垃圾邮件 - Multi-class Classification(多分类),输出类别(class1,class2,…)
eg:对文章进行分类(体育,政治,…,经济)
在求解以上任务的第一步就是要选择function set(即不同的模型),最简单的是线性模型,但很多时间会花费在非线性的模型中。
2.半监督学习
半监督学习可以减少label需要的量(data既有label data,也有unlabel data)。
3.迁移学习
迁移学习也是减少 label的量(有少量label的data,有大量和任务不相关的data(label和unlabel))。
4.无监督学习
没有任何label。比如聚类:将数据集分成由类似的对象组成多个类的过程。还可以用于降维
5.监督学习中的无结构化学习
机器的输出是要有结构性的。eg:语音辨识中,输入的是声音讯号,输出的是一个句子。
6.强化学习
没有正确答案,从评价中进行学习,只知道做的好与不好。需要一个对手。
Alpha Go:监督学习+强化学习