sklearn模型文件导出
在利用python的sklearn库进行数据挖掘与数据分析时,往往会使用到机器学习的多种智能算法进行预测和分析。有的时候需要将模型导出,以备以后对新的数据进行预测,那么久很有必要将针对原有训练数据获得的模型导出到文件中。
模型文件导出前,需要安装好第三方库,pip相应的库就可以,如果安装不了可以用下清华源的库进行pip
from sklearn.externals import joblib
安装好第三方库之后,就可以将sklearn对数据分析时的模型进行导出,这里使用SVM模型进行举例。
clf = svc = svm.SVC(kernel='linear')
rf=clf.fit(array(trainMat), array(listClasses))
现在可以导出模型文件到相应的文件夹下。
#保存模型
joblib.dump(rf,'rf.model')
在拿到新的数据之后可以将模型文件加载到内存中,并且将新数据运用在原有的模型得到相应的预测。
#加载模型
RF=joblib.load('rf.model')
#应用模型进行预测
result=RF.predict(thsDoc)