主成分分析(PCA)

1.PCA的原理

主成分分析PCA(principal component analysis)是一种降维的方法。在PCA中,数据集被从原来的坐标系统转换到一个新的坐标系统。

坐标系的选择是有数据决定的,第一个坐标选择是原始数据中方差最大的方向,第二个坐标轴选择是跟第一个坐标轴正交,并且具有最大方差的方向。其他坐标轴的选择跟这个一样的做法。

这样大部分方差大的坐标就在前几个坐标系里面了。

2.PCA计算方法:

① 计算数据集的列平均值

②用数据集-列平均值

③计算协方差矩阵

④计算协方差矩阵对应特征值和特征向量

⑤按照特征值从大到小的顺序对特征向量进行排序。

⑥选取前k个特征值对应的特征向量,组成新的矩阵W

⑦应用新生成的矩阵W计算在新空间中元数据x的坐标。y=w^{T}*x进行计算。

3.在scikit-learn中通过sklearn.decomposition.PCA类实现PCA的处理。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值