预测模型的完整流程及Python实现

doublexiao79

于 2024-07-21 22:37:37 发布

阅读量262

点赞数 9

文章标签： python 人工智能数据挖掘

本文链接：https://blog.csdn.net/u013571432/article/details/140595213

版权

1、加载函数和数据集

from sklearn.linear_model import LinearRegression
from sklearn.datasets import load_boston
from sklearn.model_selection import train_test_split
boston = load_boston()
X = boston['data']
y = boston['target']
names = boston['feature_names']

加载函数和boston数据集。

2、将数据划分为训练集测试集

X_train,X_test,y_train,y_test = train_test_split(X,y,test_size = 0.2,random_state=125)

训练集为80%，测试集为20%，设置有随机化状态，使得下次运行时提取相同数据。然后，可以选择进行数据标准化。

3、建立线性回归模型

clf = LinearRegression().fit(X_train,y_train)

调用线性回归模型，并使用了默认参数。

4、进行预测

y_pred = clf.predict(X_test)

5、输出预测结果的评价指标值

from sklearn.metrics import explained_variance_score,\
mean_absolute_error,\
mean_squared_error,\
median_absolute_error,r2_score
print('Boston数据线性回归模型的平均绝对误差为：',
     mean_absolute_error(y_test,y_pred))
print('Boston数据线性回归模型的均方误差为：',
     mean_squared_error(y_test,y_pred))
print('Boston数据线性回归模型的中值绝对误差为：',
     median_absolute_error(y_test,y_pred))
print('Boston数据线性回归模型的可解释方差值为：',
     explained_variance_score(y_test,y_pred))
print('Boston数据线性回归模型的R方值为：',
     r2_score(y_test,y_pred))

6、输出预测结果的真实值和预测值对比图

import matplotlib.pyplot as plt
from matplotlib import rcParams
rcParams['font.sans-serif'] = 'SimHei'
fig = plt.figure(figsize=(10,6)) ##设定空白画布，并制定大小
##用不同的颜色表示不同数据
plt.plot(range(y_test.shape[0]),y_test,color="blue", linewidth=1.5, linestyle="-")
plt.plot(range(y_test.shape[0]),y_pred,color="red", linewidth=1.5, linestyle="-.")
plt.legend(['真实值','预测值'])
plt.savefig('../tmp/预测结果.png') 
plt.show() ##显示图片