机器学习-训练模型的保存与恢复（sklearn）

最新推荐文章于 2024-08-12 16:39:42 发布

拾毅者

最新推荐文章于 2024-08-12 16:39:42 发布

阅读量6.6w

点赞数 12

分类专栏： Machine Learning 文章标签： python 模型持久化模型保存 joblib 模型恢复

本文链接：https://blog.csdn.net/dream_angel_z/article/details/47175373

版权

Machine Learning 专栏收录该内容

39 篇文章 13 订阅

订阅专栏

在做模型训练的时候，尤其是在训练集上做交叉验证，通常想要将模型保存下来，然后放到独立的测试集上测试，下面介绍的是Python中训练模型的保存和再使用。

scikit-learn已经有了模型持久化的操作，导入joblib即可

from sklearn.externals import joblib

模型保存

>>> os.chdir("workspace/model_save")
>>> from sklearn import svm
>>> X = [[0, 0], [1, 1]]
>>> y = [0, 1]
>>> clf = svm.SVC()
>>> clf.fit(X, y)  
>>> clf.fit(train_X,train_y)
>>> joblib.dump(clf, "train_model.m")

通过joblib的dump可以将模型保存到本地，clf是训练的分类器

模型从本地调回

>>> clf = joblib.load("train_model.m")

通过joblib的load方法，加载保存的模型。

然后就可以在测试集上测试了

clf.predit(test_X) #此处test_X为特征集

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

拾毅者

关注关注

12
点赞
踩
81

收藏

觉得还不错? 一键收藏
24
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Python机器学习实战：机器学习模型的持久化与重新加载

AI天才研究院

07-07

1039

Python机器学习实战：机器学习模型的持久化与重新加载作者：禅与计算机程序设计艺术 / Zen and the Art of Computer Programming / TextGenWebUILLM Python

机器学习（4）强化学习のQ-Learning

CCH陈常鸿Blog

11-21

869

Q-learning属于基于价值（value)的单步更新离线学习强化学习算法；什么是基于价值和单步更新看： http://blog.csdn.net/ilypl/article/details/78539754 先来看一个场景：我有一条狗，叫doge doge一开始不知道在哪里拉粑粑，现在doge有两个选择，一个是到马桶拉，另一个就是在房子里面拉。在S1状态，doge

24 条评论您还未登录，请先登录后发表或查看评论

机器学习模型的保存和调用

xiao_liushui的博客

05-09

1520

1.使用python自带的pickle from sklearn.ensemble import RandomForestClassifier from sklearn import datasets import pickle #方法一:python自带的pickle (X,y) = datasets.load_iris(return_X_y=True) rfc = RandomForestClassifier(n_estimators=100,max_depth=100) rfc.fit(X,y) p

joblib的使用

最新发布

Billie使劲学的博客

08-12

538

是 Python 中joblib库的一部分，常用于将 Python 对象序列化并保存到文件中。相比于picklejoblib更适合处理大型数据，因为它在序列化过程中效率更高，特别是在存储包含大量 numpy 数组的数据时。

joblib 读取模型后对单条数据做预测并解决Reshape your data either using array报错

呆萌的代Ma

09-20

763

用joblib读取模型并对模型做预测： # 这里假设模型已经训练完成，就不训练了 import joblib model = joblib.load("kn_model.m") pre_list = [1,2,3,4,5] # 假设这个是特征，要用模型根据这些特征值预测一个结果方法一 model.predict([pre_list]) # 对 list 在加一个[] 即可方法二 model.predict(np.array(pre_list).reshape(1, -1)) ...

scikit-learn保存和加载模型

安藤青司的博客

09-16

770

1.利用pickle import pickle #模型保存 #这里的model已经是生成好的模型了，注意一定要用"wb+"，否则会报错 model.fit(train_X, train_y) s=pickle.dumps(model) f=open('svm.model', "wb+") f.write(s) f.close() print ("Done\n") #模型调用，注意读取方式'...

joblib保存模型，特征变量

Cc_baby__的博客

11-08

751

joblib保存模型，保存变量名

【机器学习】训练好的模型的保存与恢复----joblib模块

xiaohutong1991的专栏

09-08

914

在做模型训练的时候，尤其是在训练集上做交叉验证，因为交叉验证的模型训练通常要耗费很长时间，如果再结合大数据，那么这个时间的耗费通常可以用天来计算，那么，现在就通常想要将模型保存下来，然后放到独立的测试集上测试。下面介绍的是Python中训练模型的保存和再使用。一、训练模型，显示常用的模型属性此数据为随机的自己瞎编的数据，只做演示用，各位可以通过自己的具体业务自己更改代码，此代码仅限演示用，可以当做一个test来学习。 import numpy as np from sklearn.lin

Python 机器学习 模型保存和加载

weixin_42098295的博客

02-16

1798

Python 机器学习中，模型保存和加载是两个非常重要的操作。模型保存可以将训练好的模型保存到文件，以便以后使用。模型加载可以将保存的文件加载到内存，以便进行预测或评估。最常用保存和加模型的库包括pickle和joblib，另外在使用特定的机器学习库，如scikit-learn、TensorFlow或PyTorch时，它们也提供了自己的保存和加载机制。

机器学习-Sklearn（第三版）Day4 主成分分析PCA与奇异值分解SVD

weixin_43902376的博客

12-21

396

sklearn中降维算法都被包括在模块decomposition中，这个模块本质是一个矩阵分解模块。矩阵分解可以用在降维，深度学习，聚类分析，数据预处理，低纬度特征学习，推荐系统，大数据分析等领域。SVD和主成分分析PCA都属于矩阵分解算法中的入门算法，都是通过分解特征矩阵来进行降维PCA使用的信息量衡量指标，就是样本方差，又称可解释性方差，方差越大，特征所带的信息量越多。方差计算公式中为什么除数是n-1?这是为了得到样本方差的无偏估计。

python模型保存与恢复 pmml_将python训练好的模型保存为pmml文件供java调用

weixin_39696518的博客

12-11

1037

1、PMLL概述用python训练好的机器学习模型如果上线部署，被java调用，可以将模型保存为pmml文件，那么什么是pmml呢？PMML是数据挖掘的一种通用的规范，它用统一的XML格式来描述我们生成的机器学习模型。这样无论你的模型是sklearn,R还是Spark MLlib生成的，都可以将其转化为标准的XML格式来存储。当我们需要将这个PMML的模型用于部署的时候，可以使用目标环境的解析PM...

Python库 | SciANN-0.3.3-py3.6.egg

04-19

资源分类：Python库所属语言：Python 资源全名：SciANN-0.3.3-py3.6.egg 资源来源：官方安装方法：https://lanzao.blog.csdn.net/article/details/101784059

q-learning强化学习使用基础

daoer_sofu的专栏

09-20

210

通过策略的方式来学习，q-learing（马尔科夫链模型）马尔科夫链：奖励*折扣因子，R(t)=reward(1)+yR(t+1)，马尔可夫链多次迭代后分布趋于稳定所以可以得到最优解。

如何训练和导出模型

m0_61687959的博客

01-26

1256

目标网络是DQN算法中的关键创新之一。在DQN中，每隔一定的时间步，目标网络的参数会被更新为在线网络的参数，这样可以减少学习过程中的震荡和发散问题。在不断变化的数据（如强化学习中的状态和奖励）上训练一个网络时，如果使用即时更新的数据来计算目标值，会导致训练目标和网络参数之间的紧密耦合，这种耦合会使得学习过程变得非常不稳定。在传统的Q学习中，Q表在每一步更新时都会用到，这会导致目标Q值和预测Q值在相同的过程中不断变化，从而可能导致学习过程不稳定。这个网络称为Q网络，它的输入是状态，输出是每个可能动作的Q值。

python数据处理方法——pkl格式文件_pkl文件

2301_76323084的博客

04-12

1378

在 Python 编程中，我们通常需要将数据保存到文件中以便在以后的执行中使用。pkl 文件是一种常见的文件格式，它可以保存 Python 对象的状态，并且可以在需要时将其恢复到内存中，pkl 文件是以二进制格式保存的。pkl 文件提供了一种简单而有效的方法来序列化和反序列化 Python 对象，使其易于存储、传输和共享。1.1 什么是 pkl 文件？pkl文件是指使用Python的pickle模块生成的二进制文件，用于将Python对象序列化到磁盘上。

python joblib.dump_机器学习模型的保存与加载——基于pickle模块和Scikit-learn的joblib...

weixin_33835558的博客

02-19

1万+

1.训练好一个Model以后需要保存和再次预测2.有两个模块用来保存模型 : pickle和joblib3.Sklearn的模型导出本质上是利用Python的Pickle机制。对Python的函数进行序列化，也就是把训练好的Transformer函数序列化并存为文件。代码流程：1.保存Model(注:save文件夹要预先建立，否则会报错)joblib.dump(clf, ‘save/clf.pkl...

机器学习模型的保存和加载

cai_niao_lu的博客

12-11

2467

当我们的数据集的数量非常庞大的时候，并不适合每次运行的时候都加载一遍，那样的话，所需要的时间就非常庞大。因此我们需要进行模型保存 1. 模型保存API joblib.dump(estimator, filename) estimator: 就是我们训练完成的模型 filename：就是我们要保存的文件名，通常，文件名的后缀用.pkl来保存 2. 模型加载 joblib.load(filename) ...

保存和加载模型，路径问题

走过路过要错过的博客

08-21

1572

保存和加载模型 joblib.dump(model, './saved_model/botDetect1.pkl') # save model model = joblib.load('./saved_model/botDetect.pkl') # load model 最近debug的时候最常出现的问题就是路径问题，代码只要复制黏贴到别的地方，重新跑总会有问题。切记好的路径表达方式可以省很多事，上面的路径很容易出错，用以下方式表达路径会更好。路径 os.path.abspath(__f

python数据处理方法——pkl格式文件