通俗易通了解PCA

听弧丶

已于 2022-10-15 14:29:36 修改

阅读量321

点赞数

分类专栏：机器学习

于 2022-10-15 14:29:04 首次发布

本文链接：https://blog.csdn.net/qq_50595984/article/details/127334806

版权

机器学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

PCA，主要用于数据降维。例如可以使用一个比原始图像少的多的数据维度来捕获图像的本质

什么是降维

降维就是将二维坐标轴上的一些数据变成一条直线上的数据点，但是不改变这些二维数据点的本质。

例如这是一些散点：

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-2a1zTMv1-1665814799739)(C:\Users\龚剑波\Desktop\通俗易通了解PCA.assets\image-20221015135249333.png)]$

最终通过降维映射到一根直线后，再升维便于展示，得到图像：

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-sdiWHsvn-1665814799740)(C:\Users\龚剑波\Desktop\通俗易通了解PCA.assets\image-20221015135122020.png)]$

PCA的目的就是舍去这些数据中不重要的特征，达到降维的目的。例如上图中，以这些数据点所在的直线当做新的x轴，则这些数据的y坐标值都为0，表示通过降维，不重要的特征y被舍去了。

PCA如何降维

1、首先将样本数据"中心化"，保证数据的平均值为0：

X-X的平均值

2、求出样本的协方差矩阵，代表X特征和Y特征的相关性，为了后期将Y特征或者X特征舍去使用。

3、再将协方差矩阵P进行奇异值分解：在这里插入图片描述

奇异值分解的目的： 在线性代数中，将P看做对一个向量的线性变换，奇异值分解就是将这种线性变换拆解成简单的、一步一步的旋转、伸缩、旋转，而这种变换的基础是在正交基上实现的，而U中的列向量就代表旋转后的正交基（可以理解为旋转后的坐标轴），我用e1向量和e2向量表示。所以e1向量和e2向量就是原来坐标的x轴和y轴。

我们的目的是对二维数据降维，就是尽可能将原始数据映射到新的坐标轴e1或者e2上。对于新的坐标轴e1或者e2，新数据就变成了只有前后之分，而没有上下之分（被映射到了一根坐标轴上），达到了降维的目的。

4、将 原始数据{a,b,c,d,e} 对于e1向量和e2向量进行映射，

将二维数据降维成一维数据，并且保持原始数据的本质，如图所示：
$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-lq1bc9Nu-1665814799740)(C:\Users\龚剑波\Desktop\通俗易通了解PCA.assets\image-20221015140704084.png)]$