数学建模08 —— 主成分分析法

主成分分析

PCA(Principal Component Analysis),将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法
主成分:由原始指标综合形成的几个新指标。依据主成分所含信息量的大小分为第一主成分,第二主成分等等

主成分与原始变量之间的关系:

  • 主成分保留了原始变量绝大多数信息
  • 主成分的个数大大少于原始变量的数目
  • 各个主成分之间互不相关
  • 每个主成分都是原始变量的线性组合

主成分分析法简介

  • 假设讨论的实际问题中,有p额指标,把这p个指标看做p个随机变量,记为X1,X2···Xp,主成分分析就是要把这p个指标的问题,转变为讨论p个指标的线性组合的问题,而这些新的指标F1,F2···Fk(k≤p),按照保留主要信息量的原则充分反映原指标的信息,并且相互独立
  • 这种由讨论多个指标降为少数几个综合指标的过程在数学数学上就叫做降维。主成分分析通常的做法是,寻求原指标的线性组合Fi
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
主成分分析(Principal Component Analysis,PCA)是一种常用的特征提取方。它通过线性变换将原始数据投影到一个新的坐标系中,使得投影后的数据具有最大的方差。这些新的坐标轴被称为成分,它们是原始数据中最能区分样本之间差异的方向。 PCA的基本思想是找到一个最佳的投影方向,使得数据在该方向上的投影具有最大的方差,然后找到一个与第一个方向正交的第二个方向,使得数据在该方向上的投影具有次大的方差,依此类推。通过选择前k个成分,就可以将原始数据降维到k维空间中。 PCA具有以下几个应用和优点: 1. 数据降维:通过PCA可以将高维数据降低到低维空间,减少特征数量,同时保留了原始数据中最重要的信息。 2. 去除冗余信息:PCA可以去除原始数据中的冗余信息,提取出最相关的特征。 3. 数据可视化:PCA可以将高维数据映射到二维或三维空间中,便于可视化观察和分析。 4. 数据预处理:PCA可以在机器学习任务前对数据进行预处理,减少噪声和冗余信息对模型的影响。 5. 特征选择:基于PCA的方差解释率,可以选择保留多少个成分,从而选择最具代表性的特征。 需要注意的是,PCA是一种线性降维方,对于非线性的数据分布效果可能不好。在这种情况下,可以考虑使用非线性降维方,如核主成分分析(Kernel PCA)等。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值