第十一章：（2）保存模型：（以xgboost为例）

最新推荐文章于 2024-08-17 11:24:13 发布

xiao52x

最新推荐文章于 2024-08-17 11:24:13 发布

阅读量2.4k

点赞数

分类专栏：菜菜-机器学习文章标签：机器学习 python

本文链接：https://blog.csdn.net/weixin_44953928/article/details/123775576

版权

菜菜-机器学习专栏收录该内容

21 篇文章 8 订阅

订阅专栏

文章目录

1、使用Pickle保存和调用模型
- 1.保存模型
- 2.调用模型
2.使用Joblib保存和调用模型
- 生成模型
- 调用模型
3、使用Sklearn中的模型，数据直接Xtest即可，不用在dtest = xgb.DMatrix(Xtest,Ytest)

1、使用Pickle保存和调用模型

1.保存模型

在这里插入图片描述

import pickle

dtrain = xgb.DMatrix(Xtrain,Ytrain)

#设定参数，对模型进行训练
param = {'silent':True
         ,'obj':'reg:linear'
         ,"subsample":1
         ,"eta":0.05
         ,"gamma":20
         ,"lambda":3.5
         ,"alpha":0.2
         ,"max_depth":4
         ,"colsample_bytree":0.4
         ,"colsample_bylevel":0.6
         ,"colsample_bynode":1}
num_round = 180

bst = xgb.train(param, dtrain, num_round)

#保存模型
pickle.dump(bst, open("xgboostonboston.dat","wb"))

#注意，open中我们往往使用w或者r作为读取的模式，但其实w与r只能用于文本文件，-（txt）
#当我们希望导入的不是文本文件，而是模型本身的时候，我们使用"wb"和"rb"作为读取的模式。
#其中wb表示以二进制写入，rb表示以二进制读入,使用open进行保存的这个文件是一个可以进行读取或者调用的模型

#看看模型被保存到了哪里？
import sys
sys.path

2.调用模型

#重新打开jupyter lab
from sklearn.datasets import load_boston
from sklearn.model_selection import train_test_split as TTS
from sklearn.metrics import mean_squared_error as MSE
import pickle
import xgboost as xgb

data = load_boston()
X = data.data
y = data.target
Xtrain,Xtest,Ytrain,Ytest = TTS(X,y,test_size=0.3,random_state=420)

#注意，如果我们保存的模型是xgboost库中建立的模型，则导入的数据类型也必须是xgboost库中的数据类型
dtest = xgb.DMatrix(Xtest,Ytest)

#导入模型
loaded_model = pickle.load(open("xgboostonboston.dat", "rb"))
print("Loaded model from: xgboostonboston.dat")

#做预测
ypreds = loaded_model.predict(dtest)
from sklearn.metrics import mean_squared_error as MSE, r2_score
MSE(Ytest,ypreds)
r2_score(Ytest,ypreds)

在这里插入图片描述

2.使用Joblib保存和调用模型

Joblib是SciPy生态系统中的一部分，它为Python提供保存和调用管道和对象的功能，处理NumPy结构的数据尤其高效，对于很大的数据集和巨大的模型非常有用。Joblib与pickle API非常相似，来看看代码：

生成模型

bst = xgb.train(param, dtrain, num_round)
import joblib

#同样可以看看模型被保存到了哪里
joblib.dump(bst,"xgboost-boston.dat")

调用模型

在这里插入图片描述

3、使用Sklearn中的模型，数据直接Xtest即可，不用在dtest = xgb.DMatrix(Xtest,Ytest)

Sklearn的准确率，比直接调用XGB的库要低效一些
在这里插入图片描述

xiao52x

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

第十一章：（2）保存模型：（以xgboost为例）

文章目录

1、 使用Pickle保存和调用模型

1.保存模型

2.调用模型

2.使用Joblib保存和调用模型

生成模型

调用模型

3、使用Sklearn中的模型，数据直接Xtest即可，不用在dtest = xgb.DMatrix(Xtest,Ytest)

1、使用Pickle保存和调用模型