前言:主成分分析是一种通过降维技术将多个变量化为少数几个主成分的方法,和逐步回归有相似之处。主成分分析适用于数据的线性降维,得到的主成分是由原来的变量标准化后线性组合而成的,只是主成分的个数比原来变量个数少。
参考书籍:《python数学建模算法与应用》 司守奎 孙玺菁 (强烈推荐!)
具体代码书上有写我就没有再敲出来
1、主成分分析
原则:主成分一般选取不超过6个,且累计贡献率只需要达到85%。
sklearn.decomposition模块的PCA函数实现了主成分分析,基本格式为:
f=PCA(n_components=None).fit(data)
n_components默认值为None,表示所有成分保留。n可以为int、float、str。
data只需要包含需要降维的变量数据,不需要因变量数据。