// 模型设置
from pyspark.ml.classification import RandomForestClassifier,RandomForestClassificationModel
rfc_model=RandomForestClassifier(labelCol='target',featuresCol='features',numTrees=20,maxBins=122)
// 错误操作,只是将训练集进行了预测,此时保存的不是训练好的模型
pre=rfc_model.fit(train_data).transform(train_data)
rfc_model.save('./model')
// 正确操作,先训练,后预测,再保存模型
rfc_model=rfc_model.fit(train_data)
pre=rfc_model.transform(train_data)
rfc_model.save('./model')
// 加载模型
RandomForestClassificationModel.load('./model')
记录一个pyspark.ml中机器学习模型保存读取的错误操作
于 2023-05-04 15:10:51 首次发布