对应第1,3课视频
1.什么是机器学习
2.什么情况下使用机器学习
例如:要识别图片里是否有树,我们又很难去硬写程序去定义树来识别。
3.机器学习流程
learning model = learning algorithm A and hypothesis set H
f是现实中的规律,由规律产生出了数据data,我们收集这些data作为输入,通过学习算法和候选集,推导出g,我们希望g尽可能地接近f。
机器学习分类:
1)根据输出分类:
如果输出结果离散,是分类(classification),如果连续,是回归(reggression),如果是有某种结构规律的,例如一句话的词性分析(主谓宾)等,是结构的。
2)根据数据是否有分类
可以分成:
监督:训练集(输入)的每条数据都知道其分类
无监督:训练集(输入)的每条数据都知道不知道他的分类
半监督:训练集(输入)的部分数据都知道其分类
增强学习:每次产出结果,给予一个feedback,告诉这个结果是好的或者不好的
3.根据Protocol
batch:一次性把所用数据送给分类器学习
online:连续的,一次一次改善。例如邮箱,可能是每收到一封信,就改成一次
active:由系统主动询问
4.根据输入空间
1)具体的特征,经过人为辨识的
2)原始的数据
3)抽象的