主成分分析法

主成分分析法(PCA)

在本篇博客中,我们将会介绍一种方法,叫做主成分分析法(PCA),这种方法试图确定数据接近位于的子空间。PCA相对于因子分析法将会更为直接,它仅仅需要进行特征向量的计算(在Matlab中使用eig函数),并不需要使用EM算法。
假设我们有这样的一个数据集 { x(i);i=1,...,m} 表示m个不同种类的汽车发动机的属性,例如他们的最大速度,选旋转半径等等。使得对于每个i 满足 x(i)R ( nm )。但是对于我们不知道的是——对于两个不同的属性,例如 xi xj ——分别代表车的最大速度由英里/小时和千米/小时测量的结果。这两个属性几乎是线性相关的,仅仅是由于mph和kph之间凑整导致的误差。因此,因此这个数据实际上是位于一个接近n-1维的子空间。那么,我们如何自动检测,或者是移除这个冗余呢?
考虑一个更加自然的例子,这些数据是通过调查无线操控直升飞机的飞行员得到的,其中 x(i)1 代表飞行员i的驾驶技能,而 x(i)2 代表他们对飞行的喜欢程度。由于RC直升飞机非常难操控,只有正真喜欢它的学生才能成为好的飞行员。所以两个属性 x

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
MATLAB主成分分析是一种常用的线性降维方,它通过线性投影将高维数据映射到低维空间,并希望在投影的维度上保留最大的数据信息量(方差最大)。 以下是MATLAB代码的步骤: 1. 数据导入处理:将数据导入MATLAB,并将数据标准化处理,使得每个变量的均值为0,标准差为1。 2. 计算相关系数矩阵的特征值和特征向量:利用标准化后的数据计算相关系数矩阵,并使用函数eig计算相关系数矩阵的特征值和特征向量。 3. 对特征值按降序排列:将特征值按降序排列,以便后续选择主成分。 4. 计算贡献率和累计贡献率:根据特征值计算每个主成分的贡献率和累计贡献率。 5. 选择主成分:根据设定的保留率T,选择满足累计贡献率要求的主成分数量。 6. 提取主成分对应的特征向量:根据选择的主成分数量,提取对应的特征向量。 7. 计算主成分的分:将标准化后的数据与主成分的特征向量相乘,得到每个样本在主成分上的得分。 8. 输出模型及结果报告:输出特征值、贡献率、累计贡献率、主成分的特征向量以及每个样本在主成分上的得分。 MATLAB主成分分析可以帮助我们在处理多变量数据时进行简化,并且保留了较多原数据点的特性。通过主成分分析,我们可以进一步对数据进行分析、建模以及综合评价等后续工作。<span class="em">1</span><span class="em">2</span><span class="em">3</span><span class="em">4</span>

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值