SKlearn官网 - sklearn.decomposition.PCA
一,数学原理
二,PCA的使用
class sklearn.decomposition.PCA(n_components=None, *,
copy=True, whiten=False, svd_solver='auto', tol=0.0,
iterated_power='auto', random_state=None)
1,参数
n_components:int,float,None or str
当其大于1,且为正数时:需要保留的维度
当0 < n_components < 1时:需要保留原数据可解释的度的百分之几
copy:bool, default=True
如果为False,则传递给fit的数据将被覆盖,并且运行
fit(X).transform(X)将不会产生预期的结果,请改用
fit_transform(X)。
whiten:bool, 可选(default False)
如果为True(默认情况下为False),则将components_矢量
乘以n_samples的平方根,然后除以奇异值,以确保具有单位
分量方差的不相关输出。
泛白会从转换后的信号中删除一些信息(组件的相对方差标
度),但有时可以通过使下游估算器的数据符合某些硬性假设
来提高下游估算器的预测准确性。
2,属性(方法)
components_:array, shape (n_components, n_features)
特征空间中的主轴,表示数据中最大方差的方向。组件
按排序 explained_variance_。
explained_variance_:array, shape (n_components,)
每个选定组件说明的方差量。
等于X的协方差矩阵的n_components个最大特征值。
explained_variance_ratio_:array, shape (n_components,)
每个选定组件解释的方差百分比。
如果n_components未设置,则将存储
所有分量,并且比率之和等于1.0。
singular_values_:array, shape (n_components,)
对应于每个选定组件的奇异值。奇异值等于
n_components 低维空间中变量的2范数。
mean_:array, shape (n_features,)
根据训练集估算的每特征经验均值。
等于X.mean(axis=0)。
n_components_:int
估计的组件数。
当n_components设置为'mle'或