主成分分析法（PCA）

weixin_45505744

于 2019-10-24 19:25:32 发布

阅读量1.5k

点赞数

分类专栏：人脸识别经典算法

本文链接：https://blog.csdn.net/weixin_45505744/article/details/102683949

版权

本文详细介绍了主成分分析法（PCA）的理论推导，从"0维"到"1维"再到"多维"的扩展，阐述PCA的实质是通过线性变换将高维数据降维。PCA适用于高维数据降维，不适用于分类。接着，文章给出了PCA在MATLAB中的实现，包括程序架构和具体代码，并讨论了快速PCA的计算方法。

摘要由CSDN通过智能技术生成

主成分分析法（PCA）

本篇文章仅为本人加深图像处理算法的理解，有不严谨的地方，不作为学习的参考。
参考书籍：精通Matlab数字图像处理与识别，张铮等，人民邮电出版社。

PCA的实质：就是在尽可能好地代表原始数据的前提下，通过线性变换，将高维样本数据投影到低维空间中。
主成分分析法的适用范围：主要用于高维数据的降维，不适合样本的分类。

1.1 理论推导

基本思想：代表样本的数据应该和所有的样本数据的距离最小。
推导过程：
1）“0维”，即样本数据映射到一个点上。寻找最佳数据点，设其为 $x_{0}$ ，则最佳点到样本数据的距离和为：
$D\left (x_{0} \right )=\sum_{i=0}^{n-1}\left ( x_{0}-x_{i} \right )^{2}$

设 $m=\frac{1}{n}\sum_{i=0}^{n-1}\left ( x_{i} \right )$
则
$D\left ( x\left ( 0 \right ) \right )=\sum_{i=0}^{n-1} \left ( | \left ( x_{0} -m\right ) -\left ( m-x_{i} \right )|\right )^{2}\\=\sum_{i=0}^{n-1} \left ( x_{0} -m\right ) ^{2}-2\sum_{i=0}^{n-1} \left ( x_{0} -m\right )\left ( m-x_{i} \right )+\sum_{i=0}^{n-1}\left ( m-x_{i} \right )^{2}\\=\sum_{i=0}^{n-1} \left ( x_{0} -m\right ) ^{2}+\sum_{i=0}^{n-1}\left ( m-x_{i} \right )^{2}$
所以，当 $x_{0} =m$ 时，距离和最小，最佳数据点为样本数据的均值。
样本数据压缩成一个点，无法对其进行分类。所以不现实。
2）“1维”，样本数据映射到一直线上。此直线必过样本数据均值点，所以令此直线为 $\overrightarrow{x}=m+a\overrightarrow{e}$ .a为远离均值点的距离， $\overrightarrow{e}$ 为单位向量。
则样本 $x_{i}$ 在直线 $\overrightarrow{x}$ 上的投影 $a_{i}$ .
$a_{i}=\left | x_{i} -m \right |\cdot cos\theta$
因为 $\left | \overrightarrow{e} \right |=1$