一、降维不仅可以压缩数据,使得占用较少的计算机内存或磁盘空间,同时也加快学习算法。例如将数据从三维降到二维,就是将三维向量投射到一个二维的平面上。
主成分分析(PCA)是最常见的降维算法。要将n维数据降至k维,目标是找到向量 u ( 1 ) u^{\left ( 1 \right )} u(1), u ( 2 ) u^{\left ( 2 \right )} u(2),…, u ( k ) u^{\left ( k \right )} u(k)使得总的投射误差最小。投射误差是从特征向量向该方向向量作垂线的长度。如从二维数据降到一维:
PCA算法将n维数据降至k维的实现步骤:
1、均值归一化:分别计算出各个特征的均值 μ j \mu _{j} μj,然后令 x j = x j − μ j x _{j}=x _{j}-\mu _{j} xj=xj
主成分分析
最新推荐文章于 2024-06-24 09:17:15 发布
![](https://img-home.csdnimg.cn/images/20240711042549.png)