对于机器学习的一些模型,跑完之后,如果下一次测试又需要重新跑一遍模型是一件很繁琐的事,这时候我们就需要保存模型,再加载调用。
楼主发现有这些保存模型的方法,网上有很多错误的例子,所以给大家在整理一下。(python3)
1.利用pickle
import pickle model.fit(train_X, train_y) s=pickle.dumps(model) f=open('svm.model', "wb+") f.write(s) f.close() print ("Done\n") 模型保存 这里的model已经是生成好的模型了,注意一定要用"wb+",否则会报错
f2=open('svm.model','rb') s2=f2.read() model1=pickle.loads(s2) expected = test_y predicted = model1.predict(test_X) 模型调用,注意读取方式'rb',否则会报错
2.利用joblib
from sklearn.externals import joblib model.fit(train_X, train_y) joblib.dump(model, "train1_model.m") print ("Done\n") 模型读取
model1 = joblib.load("train1_model.m") expected = test_y predicted = model1.predict(test_X) 模型调用
相对于上一方法,这个方法写起来简单明了多了。
好像还有cv方法的,楼主没有尝试。
这里的调用仅限在同一个py文件中,如果在另外一个py文件中调用,预测结果会出错,具体原因楼主也不清楚,楼主也一直在找一个在另外一个py文件中调用模型的方法,如果大家知道的话,也希望能告诉楼主,感谢!
考虑到如果预测数据又需要跑一遍模型,楼主的建议是,把保存模型的过程写进函数里面,下次不再调用该函数即可。