当训练或者计算好一个模型之后,那么如果别人需要我们提供结果预测,就需要保存模型(主要是保存算法的参数)
一、API
import joblib
#保存名为 test.pkl 的文件
joblib.dump(rf, 'test.pkl')
# 加载 test.pkl 文件
estimator = joblib.load('test.pkl')
二、实操
1,保存线性回归预测波士顿房价模型
import sklearn.datasets
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
import joblib
# 获取数据
lb = sklearn.datasets.load_boston()
# 对数据集进行划分
x_train, x_test, y_train, y_test = train_test_split(lb.data, lb.target, test_size=0.3, random_state=24)
# 对于特征值标准化处理
std = StandardScaler()
x_train = std.fit_transform(x_train)
# 使用正规方程预测
lr = LinearRegression()
lr.fit(x_train, y_train)
# 保存训练模型
joblib.dump(lr, "test.pkl")
2,加载模型进行预测
import sklearn.datasets
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error
import joblib
# 获取数据
lb = sklearn.datasets.load_boston()
# 对数据集进行划分
x_train, x_test, y_train, y_test = train_test_split(lb.data, lb.target, test_size=0.3, random_state=24)
# 对于特征值标准化处理
std = StandardScaler()
x_test = std.fit_transform(x_test)
# 加载训练模型
estimator = joblib.load('test.pkl')
y_lr_predict = estimator.predict(x_test)
print("正规方程预测的权重参数为" , estimator.coef_)
print("正规方程预测的结果为:", y_lr_predict)
print("正规方程的均方误差为:", mean_squared_error(y_test, y_lr_predict))
3,总结
- 在加载的代码中,不需要导入线性回归 LinearRegression 包进行模型预测,只需要加载模型就可以预测。
- 在保存的代码中,是对训练集的特征值 x_train 进行标准化,在加载的代码中是对测试集的特征值 x_test 进行标准化,都需要调用 fit_transform 而不能直接用 transform。