本文将介绍如何使用scikit-learn机器学习库保存Python机器学习模型、加载已经训练好的模型。学会了这个,你才能够用已有的模型做预测,而不需要每次都重新训练模型。
本文将使用两种方法来实现模型的保存和加载:Pickle和joblib。
引言
本教程将分为三部分,分别如下所示。第一部分讲解使用Pickle序列化、反序列化机器学习模型,第二部分讲解使用joblib保存、加载机器学习模型。第三部分讲解这个过程中常见的问题。
Pickle保存、加载机器学习模型joblib保存、加载机器学习模型常见问题小结Pickle保存、加载机器学习模型
Pickle是Python中序列化对象的标准方法。
通常,我们会使用pickle.dump函数来序列化机器学习模型,并将序列化的二进制保存到文件中,得到最终的模型文件。
当需要重新使用这个模型时,就可以使用pickle.load函数加载此文件,反序列化模型,并使用它来进行模型预测。
下面示例演示了如何在糖尿病数据集训练LR模型,并将模型保存到文件,并加载它以对未见测试集进行预测。该代码是将模型保存到本地文件finalized_model.sav,