主成分分析(PCA降维)与最小二乘-原理以及详细推导

最新推荐文章于 2024-08-11 23:49:39 发布

海淼林

最新推荐文章于 2024-08-11 23:49:39 发布

阅读量1.1w

点赞数 2

分类专栏：机器学习 PCA 学习文章标签：机器学习

本文链接：https://blog.csdn.net/u013648367/article/details/73824049

版权

本文深入探讨主成分分析（PCA），从最小二乘法出发，逐步推导PCA的优化目标，揭示PCA实际上寻找的是数据协方差矩阵的最大特征值对应的特征向量。通过特征值分解，PCA实现数据的降维，从而降低复杂性和提高效率。

摘要由CSDN通过智能技术生成

重新整理了PCA相关的原理和推导

从最小二乘出发, 其原理可以描述为: 在数据空间 $\chi$ 中寻找一个超平面, 让数据样本到该超平面的距离平方之和最小.

数据点到超平面距离的计算试为该点向量减该点在超平面上的投影所得向量的长度, 即
$dist(x_i,plane)=||\textbf{x}_i-\hat{\textbf{x}}_i||_2$

下标2表示L2范数, 几何解释如图
这里写图片描述
假设该超平面由 $d^{'}$ 个标准正交向量张成, 即
$span\{\textbf{w}_1,\textbf{w}_2,\textbf{w}_3,...,\textbf{w}_{d'}\},\\ s.t.\ \ \textbf{w}_i\cdot \textbf{w}_j=\delta_{ij}$
令 $W=[\textbf{w}_1,\textbf{w}_2,\textbf{w}_3,...,\textbf{w}_{d'}]$ ,则 PCA的优化目标可表示为
$arg\min_{W}{\sum_i{||\textbf{x}_i-\hat{\textbf{x}}_i||^2_2}}\\ s.t.\ \ W^TW=I\tag{1}$
由线性代数知识可知, 数据点 $x_i$ 在超平面上的投影可表示为
$\hat{\textbf{x}}_i = \sum_{j=1}^{d'}{(\textbf{w}_j^T\textbf{x}_i) \textbf{w}_j}$
于是优化目标可写为
$arg\min_{W}{\sum_i{||\sum_{j=1}^{d'}{(\textbf{w}_j^T\textbf{x}_i) \textbf{w}_j}-\textbf{x}_i||^2_2}}\\ s.t.\ \ W^TW=I\tag{2}$