2.5.1
2.5.1.1
Principal component analysis(PCA)用n维垂直向量表达原特征们尽可能多的信息。
whiten=True设置向量们各自的标准差都是1。高斯核的SVM和K-Means可能会用到。
PCA可以对各个特征的贡献进行评分,这可以用在交叉验证当中。
2.5.1.2
Incremental PCA
PCA的一个限制是必须将数据集全部加载进内存中,对于大数据集用Incremental PCA,它使用不同的处理获得与PCA相近的结果。
2.5.1.3
http://scikit-learn.org/stable/modules/decomposition.html#decompositions