1、主成分分析
(1)用途
- 非监督的机器学习算法
- 主要用于数据的降维
- 通过降维,可以得到更容易理解的特征信息
- 可以方便数据可视化、用于去噪
(2)原理
坐标系上有五个点,需要通过降维,在最大程度保留数据信息的基础上将二维表示的数据降到一维。所以我们需要找到一个轴,使得样本映射到轴上之后,样本间的方差最大(最容易区别各个样本)
。需要求一个轴的方向w=(w1,w2),使得所有样本映射到w以后,方差最大,
即 Var(x)=1m∑mi=1∥xi∥2 V a r ( x ) = 1 m ∑ i = 1 m ‖ x i ‖ 2 的值最大, x