scikit-learn的基本用法——模型保存与加载

士416

已于 2023-05-14 17:25:26 修改

阅读量3k

点赞数 1

分类专栏：机器学习文章标签： scikit-learn 机器学习支持向量机

于 2019-05-14 12:34:12 首次发布

本文链接：https://blog.csdn.net/weixin_39441762/article/details/89188427

版权

机器学习专栏收录该内容

20 篇文章 4 订阅

订阅专栏

1 模型保存

见demo:

import pickle
from sklearn.svm import SVC
from sklearn import datasets
 
# 定义分类器
svm = SVC()
# 加载iris数据集
iris = datasets.load_iris()
# 读取特征
X = iris.data
# 读取分类标签
y = iris.target
# 训练模型
svm.fit(X, y)
# 保存成python支持的文件格式pickle, 在当前目录下可以看到svm.pickle
with open('svm.pickle', 'wb') as fw:
    pickle.dump(svm, fw)
 
# 加载svm.pickle
with open('svm.pickle', 'rb') as fr:
    new_svm = pickle.load(fr)
    print new_svm.predict(X[0:1])

2 模型加载

from sklearn.externals import joblib
from sklearn.svm import SVC
from sklearn import datasets
 
# 定义分类器
svm = SVC()
 
# 加载iris数据集
iris = datasets.load_iris()
# 读取特征
X = iris.data
# 读取分类标签
y = iris.target
 
# 训练模型
svm.fit(X, y)
 
# 保存成sklearn自带的文件格式
joblib.dump(svm, 'svm.pkl')
 
# 加载svm.pkl
new_svm = joblib.load('svm.pkl')
print new_svm.predict(X[0:1])

3 sklean增量学习

from sklearn.linear_model 
import SGDClassifier 
sgd_clf = SGDClassifier() # SGDClassifier的参数设置可以参考sklearn官网 minibatch_train_iterators = iter_minibatches(data_part_file, minibatch_size=2000) 
for i, (X_train, y_train) in enumerate(minibatch_train_iterators): 
    # 使用 partial_fit ，并在第一次调用 partial_fit 的时候指定 classes      
    sgd_clf.partial_fit(X_train, y_train, classes=np.array([0, 1])) print("{} time".format(i)) # 当前次数 print("{} score".format(sgd_clf.score(X_test, y_test))) # 在测试集上看效果

4 使用partial_fit实现两个数据集的模型更新

# 加载模型为old_model
clf = old_model.copy()
new_model = clf.partial_fit(x_new,y_new)

# 训练出新模型，but 需要清楚哪些模型有partial_fit。

5 sklearn中的coef_和intercept_

6 skearn中有partial_fit的有哪些模型

朴素贝叶斯的三个常用模型：高斯、多项式、伯努利

参考：scikit-learn的基本用法(八)——模型保存与加载

使用sklearn进行增量学习

sklearn中的coef_和intercept_

朴素贝叶斯的三个常用模型：高斯、多项式、伯努利

士416

关注

1
点赞
踩
12

收藏

觉得还不错? 一键收藏
2
评论
scikit-learn的基本用法——模型保存与加载

1 模型保存见demo:import picklefrom sklearn.svm import SVCfrom sklearn import datasets # 定义分类器svm = SVC()# 加载iris数据集iris = datasets.load_iris()# 读取特征X = iris.data# 读取分类标签y = iris.target# 训练...
复制链接

扫一扫

专栏目录