详解PCA（二）

最新推荐文章于 2023-02-20 18:49:55 发布

zhfplay

最新推荐文章于 2023-02-20 18:49:55 发布

阅读量315

点赞数

分类专栏：机器学习算法文章标签： PCA 主成分分析降维解释方差

本文链接：https://blog.csdn.net/zhfplay/article/details/100931890

版权

本文深入探讨PCA（主成分分析）中主成分个数的选择，通过特征值下降速率和解释方差比例来决定降维程度。同时讲解如何处理新样本以及数据重构的过程。

摘要由CSDN通过智能技术生成

一、主成分的个数

上一篇文章《详解PCA》我们已经分析了如何计算各个成分的方向，并且能够将原样本矩阵投影到这个新的空间。但是，PCA的主要目的是降维，那么我们必须要面对的问题是：要选择几个主成分？当然我们可以用交叉验证去选取合适的主成分个数。然而，有没有更加值观的、快速的、简单的方法呢？答案是，有的！

1、特征值的下降速率

如果我们将协方差矩阵所有的特征值按从大到小的顺序进行排列，并且显示在一张柱形图上，我们可以计算各个特征值相对于最大的特征值的下降速率。我们只需要设定一个阈值，将下降速率太大的特征值和对应的主成分去掉就行了。
在这里插入图片描述
如上图，我们选取前12个主成分就差不多了。

2、解释方差

解释方差是指将我们的原始数据投影到一个新的空间后具有的总方差。假设我们将原始数据投影到由 $v_1,\dots,v_k$ 张成的空间，那么他的解释方差就是 $\lambda_1+\dots+\lambda_k$ ，我们将证明这条结论。

假设原始的数据集是 $\left(x_{1}, \ldots, x_{n}\right)$ , 将其投影到由 $v_1,\dots,v_k$ 张成的空间 $V_k$ 后的坐标为 $\left(V_{k}^{T} x_{1}, \ldots, V_{k}^{T} x_{n}\right)$ ，而 $\left(V_{k}^{T} x_{1}, \ldots, V_{k}^{T} x_{n}\right)$ 的解释方差可以由下面的方法计算得到：

最低0.47元/天解锁文章

zhfplay

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
详解PCA（二）

一、主成分的个数上一篇文章《详解PCA》我们已经分析了如何计算各个成分的方向，并且能够将原样本矩阵投影到这个新的空间。但是，PCA的主要目的是降维，那么我们必须要面对的问题是：要选择几个主成分？当然我们可以用交叉验证去选取合适的主成分个数。然而，有没有更加值观的、快速的、简单的方法呢？答案是，有的！1、特征值的下降速率如果我们将协方差矩阵所有的特征值按从大到小的顺序进行排列，并且显示在一张柱...
复制链接

扫一扫

专栏目录