http://scikit-learn.org/stable/modules/decomposition.html#lsa
2.5.1:PCA
标准PCA:只支持批量处理
incremental PCA:支持分批处理,对于内存容不下的情况很好
Approximate PCA:RandomizedPCA 通过computation to an approximated estimate(而非确切的) of the singular vectors,减少运行时间、存储空间。
Kernel PCA:通过使用核,达到非线性维度缩减(achieves non-linear dimensionality reduction through the use of kernels)。
SparsePCA and MiniBatchSparsePCA:faster but less accurate. The increased speed is reached by iterating over small chunks of the set of features, for a given number of iterations.
2.5.2:Truncated singular value decomposition and latent semantic analysis(截断SVD和LSA/LSA)
先说明:latent semantic indexing, LSI和latent semantic analysis, LSA本质一样。
TruncatedSVD是SVD的变形,只计算用户指定的最大的K,个奇异值。
具体内容参考我的这篇文章吧:
http://blog.csdn.net/mmc2015/article/details/46867773