Python数据挖掘建模 chapter_6 主成分分析(简)

主成分分析简介:

对指标变量矩阵进行主成分分析,是降维方法之一,应调用 from sklearn.decomposition import PCA

数据举例

num gps_w gps_j price st
A0001 22.56614225 113.9808368 66 0
A0002 22.68620526 113.9405252 65.5 0
A0003 22.57651183 113.957198 65.5 1
A0004 22.56484081 114.2445711 75 0
A0005 22.55888775 113.9507227 65.5 0
A0006 22.55899906 114.2413174 75 0
A0007 22.54900371 113.9722597 65.5 1
A0008 22.56277351 113.9565735 65.5 0
A0009 22.50001192 113.8956606 66 0
(详细为2017全国大学生数学建模大赛 B题数据)
#-*- coding: utf-8 -*-
#主成分分析 降维
import pandas as pd

#参数初始化
inputfile = 'pdata.xls'
outputfile = 'dimention_reducted.xls' #降维后的数据

data = pd.read_excel(inputfile, index_col = u'num') #读入数据

from sklearn.decomposition import PCA

pca = PCA(n_components='mle',copy=False,whiten=False)
pca.fit(data)
pca.components_ #返回模型的各个特征向量
a=pca.explained_variance_ratio_ #返回各个成分各自的方差百分比
low_d=pca.transform(data)#降维处理
print low_d
print a
#pca.inverse_transform(low_d) #复原数据
结果数据过长

[[ -3.1286575    0.70258512   0.37438004]
 [ -3.62752518   0.6594219    0.28951319]
 [ -3.60629098  -0.27213001   0.63513077]
 ..., 
 [ 15.89052204   0.11115613   0.43928345]
 [ -3.60214682  -0.40482886   0.27289147]
 [ 15.89614163  -0.10911559  -0.30845716]]
[ 0.97968047  0.01112823  0.0077572 ]

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值