matlab主成分分析散点图_Matlab主成分分析(特征值顺序)

使用PCA,返回的每个主要组件将是原始列/维度的线性组合。也许一个例子可能会消除你的任何误解。

让我们考虑包含150个实例和4个维度的Fisher-Iris数据集,并对数据应用PCA。为了使事情更容易理解,我首先将数据置于零中心,然后再调用PCA函数:

load fisheriris

X = bsxfun(@minus, meas, mean(meas)); %# so that mean(X) is the zero vector

[PC score latent] = princomp(X);

让我们看一下第一个返回的主成分(PC矩阵的第一列):

>> PC(:,1)

0.36139

-0.084523

0.85667

0.35829

这表示为原始尺寸的线性组合,即:

PC1 = 0.36139*dim1 + -0.084523*dim2 + 0.85667*dim3 + 0.35829*dim4

因此,为了在由主成分构成的新坐标系中表达相同的数据,新的第一维应该是根据上述公式的原始线的组合。

我们可以简单地将此计算为X*PC,这正是PRINCOMP(score)的第二个输出中返回的内容,以确认此尝试:

>> all(all( abs(X*PC - score) < 1e-10 ))

1

最后,每个主成分的重要性可以通过它解释的数据的方差来确定。这是由PRINCOMP的第三个输出(latent)返回的。

我们可以在不使用PRINCOMP的情况下自行计算数据的PCA:

[V E] = eig( cov(X) );

[E order] = sort(diag(E), 'descend');

V = V(:,order);

协方差矩阵V的特征向量是主要成分(与PC相同,尽管符号可以反转),相应的特征值E代表方差量解释(与latent相同)。注意,习惯上用它们的特征值对主成分进行排序。和以前一样,为了在新坐标中表达数据,我们只需计算X*V(如果您确保匹配符号,则应与上面的score相同)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值