sklearn.decomposition.PCA
class sklearn.decomposition.PCA(n_components=None, *, copy=True, whiten=False, svd_solver='auto', tol=0.0, iterated_power='auto', random_state=None)
官方:link
PCA是特征降维中一种 线性降维 的方法。
与特征选择不同(直接筛选出特征),PCA是通过线性变换,将数据投影到低维线性空间来实现降维的目的。
PCA的核心思想是:将数据投影到低维线性空间时,要保证投影后的样本方差最大化。根据这个原则,就可以建立优化目标,求出投影矩阵。事实上,最后求解出来,投影矩阵的列向量(也就是低维线性空间的基)就是原样本 协方差矩阵 的 最大的几个特征值 对应的 特征向量。