一:简介
主成分分析是用降维的方法将多指标转化为几个综合指标的多元统计分析方法,使用较少的变量去解释原来资料中的大部分信息。
二:基本原理和步骤
1.基本原理:略。
需要注意的是:
(1)主成分分析法结果受量纲的影响,需要先进行无量纲化处理,然后用协方差或相关系数矩阵进行分析。
(2)实际研究中选取的主成分不超过6个,只需要贡献率超过85%即可。
2.基本步骤:
三:例题
#程序文件Pex11_7.py
import numpy as np
from sklearn.decomposition import PCA
a=np.loadtxt("Pdata11_7.txt")
b=np.r_[a[:,1:4],a[:,-3:]] #构造数据矩阵
# #np.r_是按列连接两个矩阵,就是把两矩阵上下相加,要求列数相等。‘
#所以上面构造矩阵的方法研究一下就明白了。
md=PCA().fit(b) #构造并训练模型
print("特征值为:",md.explained_variance_)
print("各主成分的贡