一.工具
sklearn官方给出了两种保存模型的方式:3.4. Model persistence
其中一种是pickle的方式,还有一种就是joblib包的使用.这里仅仅介绍更加简单的方便的joblib方法.
载入joblib很简单,一句话就行了.
from sklearn.externals import joblib
接下来就给出常用的joblib几个常用的函数的详细介绍.更多的细节可以参考:Joblib: running Python functions as pipeline jobs
Ⅰ.存储模型(joblib.dump)
joblib.dump(value, filename, compress=0, protocol=None, cache_size=None)
作用:
持久化任意的python对象为一个文件.并且返回一个字符串列表,表示这些数据分别存放的位置.参数:
value: 待存储的Python对象
filename: 字符串或者pathlib,表示待存储的完整路径(当然包括文件名),要是使用压缩的话,下面这些扩展