利用主成分PCA进行特征提取

最新推荐文章于 2024-06-17 11:33:40 发布

ban2413

最新推荐文章于 2024-06-17 11:33:40 发布

阅读量2.9k

点赞数

文章标签：人工智能 matlab

原文链接：http://www.cnblogs.com/Hyacinth-Yuan/p/8393150.html

版权

本文详细介绍了主成分分析（PCA）原理及其在特征提取中的作用，特别是如何通过PCA解决高维数据的降维问题。PCA通过去相关和最大化方差来提取主要特征，适用于图像分类等问题。文中通过实例解释了PCA的步骤，包括数据居中、标准化、特征分解和数据投影。同时，讨论了PCA的局限性，如假设数据正态分布和线性关系，以及可能存在的信息损失。

摘要由CSDN通过智能技术生成

本文将介绍主成分分析（Principal Component Analysis，PCA）原理，并且它如何在分类问题中发挥降维的作用。译自

Feature extraction using PCA。

简介

本文将介绍主成分分析（Principal Component Analysis，PCA）原理，并且它如何在分类问题中发挥降维的作用。

在前面我们讲到过维度灾难，分类器容易对高维的训练集产生过拟合。那么，哪些特征是更好的呢，而哪些又该从高维中除去呢

如果所有的特征向量间相互独立，我们可以很容易的去除区分度很小的特征向量，区分度小的向量可通过特征选择相关方法识别。然而，在实际中，很多向量彼此依赖或依赖潜在的未知变量。一个单一的特征可以用一个值来代表很多信息的集合。移除这样的特征将移除比所需要的更多的信息。在下一节，我们将介绍作为特征提取的解决此问题的PCA方法，并从两个不同的角度介绍它的内在工作原理。

PCA：一种去相关方法

屡见不鲜的是，特征都是相关的。例如，我们想要使用图像中每个像素的红色，绿色和蓝色分量来进行图像分类（例如侦测猫和狗），对红光最敏感的图像传感器也捕获一些蓝光和绿光。类似地，对蓝光和绿光最敏感的传感器也对红光表现出一定程度的敏感度。结果，像素的R，G，B分量在统计上是相关的。因此，简单地从特征向量中消除R分量，也隐含地除去关于G和B信道的信息。换句话说，在消除特征之前，我们想要转换完整的特征空间，从而得到底层的不相关分量。

下图是一个二维特征空间的例子：

图一