当要分解的数据集太大而无法容纳在内存中时,通常使用增量主成分分析(IPCA)来代替主成分分析(PCA)。IPCA使用与输入数据样本数无关的内存量为输入数据建立一个低阶近似值(low-rank approximation)。它仍然依赖于输入数据的特征,但更改了批处理大小来控制内存的使用情况。
本示例通过可视化来确保IPCA能够找到与PCA(与信号翻转)相似的数据投影,而一次仅需处理几个样本。由于IPCA适用于不能在主存储器中训练的大型数据集,因此本示例可以被视为“toy example”,需要使用增量方法。![a80e1fe25a332bd5bcbd0d30806bcbc9.png](https://i-blog.csdnimg.cn/blog_migrate/692bc96e2d0aad74ea46723d4c730feb.png)
![6ca38dad3fb04f1146c92da90aa70979.png](https://i-blog.csdnimg.cn/blog_migrate/f63d271c07984b5de14ce7dca358fc00.png)
print(__doc__)# 作者: Kyle Kastner# 许可证: BSD 3 clauseimport numpy as npimport matplotlib.pyplot as pltfrom sklearn.datasets im