sklearn模型持久化

在用sklearn训练了模型之后,需要保存模型,以便日后使用。下面介绍了关于如何持久化sklearn模型的方法。

可以使用python自带的pickle模块保存和加载模型,下面是用SVM做iris数据集分类的例子。

>>> from sklearn import svm
>>> from sklearn import datasets
>>> clf = svm.SVC()
>>> X, y= datasets.load_iris(return_X_y=True)
>>> clf.fit(X, y)
SVC()

>>> import pickle
>>> s = pickle.dumps(clf)
>>> clf2 = pickle.loads(s)
>>> clf2.predict(X[0:1])
array([0])
>>> y[0]
0

一般情况下,sklearn中使用joblib来代替pickle,包括dump和load方法。joblib对于保存和加载内部包含大量numpy arry数据的对象更加高效。

保存:

>>> from joblib import dump, load
>>> dump(clf, 'filename.joblib') 

加载:

clf = load('filename.joblib') 
clf2.predict(X[0:1])
print(y[0])
0

与上面输出结果一致,这里除了传入文件名,还可以传入文件对象

翻译自:https://scikit-learn.org/stable/modules/model_persistence.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值