PCA主成分分析

qq_54867493

已于 2022-10-13 15:48:06 修改

阅读量1k

点赞数 1

分类专栏：机器学习文章标签： python 开发语言

于 2022-09-26 10:08:01 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_54867493/article/details/127040512

版权

机器学习专栏收录该内容

16 篇文章 1 订阅

订阅专栏

假设我们有这样的两组数据：

以Data1为横坐标，Data2为纵坐标，在二维坐标轴上表示出来，

D1的平均值为5.83，D2的平均值为3.63。我们将所有数据减去对应的均值，完成了数据中心化。

原始数据为二维的，我们要将数据降成一维的，并尽可能保留较多的原始信息。因此我们需要找到一个方向，使这些点在这个方向上的投影分散得最开。

提到分散度，我们会想到方差

计算得 $s^{2}(D_{1})=18.97$ ， $s^{2}(D_{2})=3.13$

协方差公式为

计算得 $cov(D1,D2)=6.49$

实际上，我们可以用一个协方差矩阵表示这些结果，其中A表示将中心移到原点后的数据矩阵

注释：

接下来，我们要把它引导到平面的某一单位向量上。这个单位向量命名为 $v$ ，值为 $(x_{0},y_{0})$

所以某个点 $a$ 的坐标向量和该单位向量的内积，即这个点的向量在单位向量上的投影，记为S，

那么，最大分散化就是在某方向上的投影至中心距离方差最大：

接下来，我们的任务是使用拉格朗日乘子法求 $s$ 的最值 :

求偏导，令偏导=0，

( $v$ 是 $C$ 的特征向量， $\lambda$ 是 $C$ 的特征值 )

$det(C-\lambda E)=0$ ，解得 $\lambda =21.28$ 和 $0.81$

$\lambda =21.28$ 时，代入到 $Cv^{T}=\lambda v^{T}$ ，得到特征向量 [0.94,0.34]；

注释：

$\lambda =0.81$ 时，得到特征向量 [0.34,-0.94]，即为图中蓝线的方向

几何意义：假设点 $a$ 在 $D1$ $D2$ 的坐标系的坐标为 (4.17,2.37)，它在 $PC1$ 上投影长度为4.72，在 $PC2$ 上投影长度为0.81，那么它既可以理解为由 4.17个 $D1$ 和2.37个 $D2$ 组成的，也可以理解为由4.72个 $PC1$ 和0.81个 $PC2$ 组成的。

把 $Cv^{T}=\lambda v^{T}$ , $\overrightarrow{v}\overrightarrow{v}^{T}=1$ ( $v$ 是单位向量) 代入最大分散化的公式 $s^{2}=\overrightarrow{v}C\overrightarrow{v}^{T}$ 中，

$s^{2}=\overrightarrow{v}\lambda \overrightarrow{v}^{T}=\lambda\overrightarrow{v} \overrightarrow{v}^{T}=\lambda$

所以某一主成分方向上投影的方差即为 $\lambda$ ，假设我们要求 $k$ 个主成分，只需要找到前 $k$ 大的 $\lambda$ ，并计算其特征向量。

我们也可以计算各个主成分涵盖了多少的信息，

计算可知，我们只需要保留主成分1就可以保留绝大多数信息。于是我们成功地将原有的二维数据信息转换成了这些点在主成分1方向上的投影的一维数据。

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。