principal Component Analysis
- 主成分分析是梯度分析法的一种应用
- 主成分分析是一个非监督的机器学习算法
- 主要用于数据的降维
- 通过降维,可以发现更便于人类理解的特征
- 其他应用:可视化;去噪
1 目标
1.1 找到目标轴
找到让样本间间距最大的轴
如何定义样本间间距? —— 方差(Variance)
方差:表示样本间成分的疏密程度
Var(x)=1m∑mi=1(xi−x⎯⎯⎯)2 V a r ( x ) = 1 m ∑ i = 1 m ( x i − x ¯ ) 2
目的是将所有样本映射到轴后,方差最大
1.2 将样本均值归为0(demean)
- 均值归0:所有样本减去均值,使样本的每个维度均值都是0
- 此时, Var(x)=