【Sklearn】3种模型保存的文件格式及调用方法

落叶阳光

已于 2022-09-17 10:47:46 修改

阅读量5.5k

点赞数 2

于 2022-02-12 18:32:58 首次发布

本文链接：https://blog.csdn.net/xiangxiang613/article/details/122900201

版权

算法篇专栏收录该内容

48 篇文章

订阅专栏

本文介绍了使用Sklearn库进行模型保存和调用的三种常见方式：pickle、sklearn自带的pkl格式和适合Java的PMML格式。通过实例演示了如何操作，并提供了Java调用示例。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Sklearn保存和调用模型的三种方式

方式一：保存为python支持的pickle格式

import pickle
from sklearn.svm import SVC
from sklearn import datasets

# 定义分类器
svm = SVC()

# 加载iris数据集
iris = datasets.load_iris()
# 读取特征
X = iris.data
# 读取分类标签
y = iris.target

# 训练模型
svm.fit(X, y)

# 保存成python支持的文件格式pickle, 在当前目录下可以看到svm.pickle
with open('D:/Model/svm.pickle', 'wb') as fw:
    pickle.dump(svm, fw)

# 调用svm.pickle
with open('D:/Model/svm.pickle', 'rb') as fr:
    new_svm = pickle.load(fr)
    print (new_svm.predict(X[0:1]))   # 预测新的数据

方式二：保存为sklearn自带的文件pkl格式

from sklearn.externals import joblib
from sklearn.svm import SVC
from sklearn import datasets

# 定义分类器
svm = SVC()

# 加载iris数据集
iris = datasets.load_iris()
# 读取特征
X = iris.data
# 读取分类标签
y = iris.target

# 训练模型
svm.fit(X, y)

# 保存成sklearn自带的文件格式
joblib.dump(svm, 'D:/Model/svm.pkl')

# 调用svm.pkl
new_svm = joblib.load('D:/Model/svm.pkl')
print(new_svm.predict(X[0:1]))  # 预测新的数据

方式三：保存为java支持的pmml格式

pip install sklearn2pmml

# 保存为java支持的格式
from sklearn2pmml import PMMLPipeline, sklearn2pmml
from sklearn.ensemble import RandomForestClassifier
from sklearn import datasets

# 加载iris数据集
iris = datasets.load_iris()
# 读取特征
X = iris.data
# 读取分类标签
y = iris.target

rf = PMMLPipeline([
    ("classifier", RandomForestClassifier())
])

# 训练模型
rf.fit(X, y)

# 保存成java支持的文件格式pmml, 在当前目录下可以看到svm.pmml
sklearn2pmml(rf, 'D:/Model/rf.pmml')

java调用:

可参考https://blog.csdn.net/hellozhxy/article/details/82142700

python调用：
pip install pypmml

from pypmml import Model

model = Model.fromFile(path)
y_predict = model.predict(X_test)