PCA：matlab主成份分析

最新推荐文章于 2024-09-05 23:36:04 发布

泡温水澡的青蛙

最新推荐文章于 2024-09-05 23:36:04 发布

阅读量6.3k

点赞数 1

分类专栏： matlab 文章标签： pca matlab

本文链接：https://blog.csdn.net/a1154761720/article/details/50721452

版权

本文介绍了如何使用Matlab进行PCA（主成份分析），包括数据预处理、PCA分析步骤、降维方法以及如何处理大规模数据。强调PCA在处理训练集和测试集时的注意事项，并提供了PCA过程中关键步骤的代码示例。建议选取的主成份能解释超过95%的原空间信息。

摘要由CSDN通过智能技术生成

通常对于高维数据需要进行降维，matlab中有pca进行数据分析，进行主成份分析：principal component analysis。
matlab调用PCA的方式如下：

XMean = mean(X);%X每行是一个实例，每列代表一个属性
X = bsxfun(@minus,X,XMean);%去中心
[eigenVectors,scores,eigenValues] = pca(X);
transMatrix = eigenVectors(:,1:K);
X = X*transMatrix;

第一步是对求训练集数据的均值；X代表原始的数据矩阵，是一个N*d的矩阵，N代表样本个数，d代表特征的原始维数；
第二步是对训练集去中心化；
第三步是pca分析：eigenVectors是一个d*d的矩阵，每列代表对应特征值的特征向量，scores是N*d的矩阵，eigenValues是对应的特征值向量，与eigenVectors的列相对应。
第四步取特征向量矩阵的前K列作为变换矩阵
第五步是对数据进行变化，降维。
**如果数据既有训练集又有测试集，一般先对训练集进行PCA降维，得到相应的transMatrix；
然后在测试集上减去训练样本的均值trainMean，然后乘以变换矩阵得到对应的降维后的测试集&#