1.机器学习基础
本次笔记只讲在干嘛、分类、常见派别这三部分。
1.1在干嘛
给定数据集D:{x,y},其中,x是输入(input),y是输出(output)。其实就是求P(y|x)=P(x,y)/P(x),即条件概率。
1.2常见派别
目前主要有生成派(generative model)、模式派(pattern model)两类。
1.2.1生成派(generative model):
主要操作是估算P(x,y)。
缺点:数据量要很大
优点:有理论基础;可解释性高
1.2.2模式派(pattern model):
主要操作是估计P(y)。利用联合概率P(x,y)正比于P(y|x),而P(x,y)=P(x|y)*P(y)。
1.3分类
主要有监督学习(supervised learning)、无监督学习(unsupervised learning)、强化学习(reinforcement learning)三类。
1.3.1监督学习(supervised learning)
定义:
训练含有很多特征的数据集。样本都有一个标签或目标,标签对模型有修正作用。观察随机向量x及其相关联的y,估计p(y | x)。
常见分类
1.3.2无监督学习(unsupervised learning)
常见分类如下:
1.3.3强化学习(reinforcement learning)
应用:博弈论
1.3.4新兴方法
online learning在线学习
transfer learning迁移学习
multi-task learning多任务学习
federating learning联邦学习
1.4推荐书籍
Duda:Pattern Recognition(PR)
Haslie:The elements of statistic learning
杉山将:图解机器学习
李沐:Dive into deep learning