数据预处理-数据规约-属性规约

原数据:

#-*- coding: utf-8 -*-

import pandas as pd
from sklearn.decomposition import PCA    #PCA主成分分析函数

inputfile = '../data/principal_component.xls'
outoutfile = './dimention_reducted.xls'    #降维后的数据

data = pd.read_excel(inputfile)

pca = PCA()
pca.fit(data)
pca.components_    #返回模型的各个特征向量
pca.explained_variance_ratio_    #返回各个成分各自的方差百分比; variance:方差; ratio:百分比

输出:pca.explained_variance_ratio_

[8.19870356e-01 1.24403427e-01 4.35654729e-02 1.01185073e-02
 1.44614964e-03 3.46741246e-04 1.51101937e-04 9.82436662e-05]

从上面的结果可以得到特征方程det有8个特征根,对应8个特征向量以及各个成分的方差百分比(也称贡献率),其中方差百分比越大,说明向量的权重越大。当选取前3个主成分时,累计的贡献率已达到98.78%(81.98%+12.44%+4.36%),说明选取前3

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值