主成分分析PCA

最新推荐文章于 2023-08-05 17:33:26 发布

vincent2610

最新推荐文章于 2023-08-05 17:33:26 发布

阅读量464

点赞数

分类专栏：机器学习数学文章标签： PCA

本文链接：https://blog.csdn.net/vincent2610/article/details/60467609

版权

机器学习同时被 2 个专栏收录

29 篇文章 0 订阅

订阅专栏

数学

6 篇文章 0 订阅

订阅专栏

PCA的目的
PCA（Principal Component Analysis）将原始数据降维成另一组数据。转换后的数据有两个要求：
① 同组数据间尽可能发散（方差越大越好）
② 各维数据间尽可能线性无关（协方差越小越好）
PCA的原理
首先我们假设原始数据X为m组2维：
$X = (a 1 b 1 a 2 b 2 . . . . . . a m b m)$ $X= \begin{pmatrix} a_1& a_2 & ... & a_m\\ b_1& b_2 & ... & b_m \end{pmatrix}$
那么上面的两个要求可以用协方差矩阵表示：
$1 m X X T = ⎛ ⎝ ⎜ ⎜ ⎜ ⎜ ⎜ 1 m \sum i = 1 m a 2 i 1 m \sum i = 1 m a i b i 1 m \sum i = 1 m a i b i 1 m \sum i = 1 m b 2 i ⎞ ⎠ ⎟ ⎟ ⎟ ⎟ ⎟$ $\frac{1}{m}XX^T= \begin{pmatrix} \frac{1}{m}\sum_{i=1}^ma_i^2 & \frac{1}{m}\sum_{i=1}^ma_ib_i\\ \frac{1}{m}\sum_{i=1}^ma_ib_i& \frac{1}{m}\sum_{i=1}^mb_i^2 \end{pmatrix}$
我们希望协方差矩阵是一个对角阵最好，因为这样方差不为零，而协方差为零。
假设原始数据为X，它的协方差矩阵为C
假设X经过P变化为Y，即Y=PX
假设降维后数据为Y，它的协方差矩阵为D
我们现在的目的是让D为对角阵，由于有以下性质：
$D = = = = = 1 m Y Y T 1 m (P X) (P X) T 1 m P X X T P T P (1 m X X T) P T P C P T$ $\begin{matrix} D& = & \frac{1}{m}YY^T\\ & = & \frac{1}{m}(PX)(PX)^T\\ & = & \frac{1}{m}PXX^TP^T\\ & = & P(\frac{1}{m}XX^T)P^T\\ & = & PCP^T \end{matrix}$
此时，目标更明确了，我们要找到一个矩阵P，是的 $PCP^T$ 是对角阵。
如何找P
数学上已经证明了，一个n行n列的对称矩阵C可以找到n个单位正交向量 $e_1, e_2,..., e_n$ ，将其按列组合成 $E=(e_1, e_2,..., e_n)$ ，使得 $ECE^T$ 。所以我们千辛万苦要找的P就是特征向量按列组成的矩阵。
PCA算法步骤
设有m条n维数据
①将数据组成n行m列的矩阵X
②将X的每一行（代表一个属性字段）进行零均值化，即减去这一行的均值
③求出协方差矩阵 $C=\frac{1}{m}XX^T$
④求出C的特征值和特征向量
⑤将特征向量按照特征值大小从上到下按行排列成矩阵，取前k行组成矩阵P
⑥Y=PX即为降维到k维后的数据

参考：http://blog.codinglabs.org/articles/pca-tutorial.html

vincent2610

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
主成分分析PCA

PCA的目的 PCA（Principal Component Analysis）将原始数据降维成另一组数据。转换后的数据有两个要求： ① 同组数据间尽可能发散（方差越大越好） ② 各维数据间尽可能线性无关（协方差越小越好）PCA的原理首先我们假设原始数据X为m组2维： X=(a1b1a2b2......ambm)X=\begin{pmatrix} a_1& a_2 & ... &
复制链接

扫一扫