对一些应用来说,需要处理的样本和特征的规模比较大,速度要求很高,使用传统方法比较困难。针对这些情况scikit-learn有很多方式来帮助你进行系统的扩展。
6.1. 使用out-of-core学习进行扩展
Out-of-core(外存储)学习是一种用来对数据量超过计算机内存(RAM)的数据进行学习的技术。
下面是系统为了实现这个目的设计概括:
1.实现实例流。
2.实现从实例中抽取特征。
3.实现增量计算。
6.1.1实例流
从硬盘文件、数据库、网络数据流中产生实例的读操作。如何实现这种操作的细节这里不介绍了。
6.1.2特征抽取
6.1.3增量学习
(未完结)