第一章 统计学习方法概论
1. 统计学习
- 数据:计算机及互联网上的各种数字、文字、图像、视 频、音频数据以及它们的组合。
- 数据的基本假设是同类数据具有一定的统计规律性。
- 统计学习的目的:用于对数据(特别是未知数据)进行预测和分析。
统计学习的方法:
- 监督学习
- 多用于分类、标注与回归问题中
- 非监督学习
- 半监督学习
- 强化学习:
- 非监督学习的一种,随机采取一个动作,根据得到的反馈,来决定策略:继续该动作或是换个动作。如:给瓜苗浇水,如果瓜苗变得好了,就继续浇水。
统计学习的研究
- 统计学习方法:决策树、HMM等
- 统计学习理论:统计学习方法的有效性和效率和基本理论
- 统计学习应用:如好瓜&坏瓜
2. 监督学习
- 实例:如西瓜A
- 特征向量:多个特征形成一个列向量
- 假设输入与输出的随机变量X和Y遵循联合概率分布P(X,Y),对于学习系统来说,联合概率分布P(X,Y)是未知的