一、降维不仅可以压缩数据,使得占用较少的计算机内存或磁盘空间,同时也加快学习算法。例如将数据从三维降到二维,就是将三维向量投射到一个二维的平面上。
主成分分析(PCA)是最常见的降维算法。要将n维数据降至k维,目标是找到向量 u ( 1 ) u^{\left ( 1 \right )} u(1), u ( 2 ) u^{\left ( 2 \right )} u(2),…, u ( k ) u^{\left ( k \right )} u(k)使得总的投射误差最小。投射误差是从特征向量向该方向向量作垂线的长度。如从二维数据降到一维:
PCA算法将n维数据降至k维的实现步骤:
1、均值归一化:分别计算出各个特征的均值 μ j \mu _{j} μj,然后令 x j = x j − μ j x _{j}=x _{j}-\mu _{j} xj=xj
主成分分析
主成分分析(PCA)是一种常见的降维算法,用于压缩数据并减少计算复杂度。PCA通过寻找最大化方差的特征向量来降低数据的维度,最小化投影误差。在实现中,包括数据的均值归一化、计算协方差矩阵、特征值分解等步骤。吴恩达机器学习课程中,PCA被应用于人脸图像数据集的降维,通过可视化展示了降维前后的效果。文章还提到,保持独立和学习对于个人成长的重要性。
摘要由CSDN通过智能技术生成