分别使用线性回归、二次多项式回归、三次多项式回归对数据集Boston进行回归分析,并比较这三种回归的结果。
一、加载数据
# Boston数据集
# 使用load_boston()方法,从sklearn.datasets模块导入波士顿房价数据集
from sklearn.linear_model import LinearRegression
from sklearn.datasets import load_boston
boston=load_boston()
X=boston.data
y=boston.target
二、模型训练
1、线性回归
LinearRegression()是sklearn.linear_model的一个类,使用它进行线性回归分析,先生成一个LinearRegression类的实例,使用实例调用fit(X,y)方法来拟合数组自变量X和目标集y,拟合好回归方程后,可使用predict()方法预测新样本的回归值。
# 线性回归部分
clf_lin_reg=LinearRegression().fit(X,y) # 生成一个线性回归模型的实例并调用模型
y_lin_reg_pred=clf_lin_reg.predict(X) # 预测值
import matplotlib.pyplot as plt
# 可视化部分
plt.rcParams['font.sans-serif']='SimHei' # 设置字体,显示中文
plt.rcParams['axes.unicode_minus']=False # 坐标轴刻度显示负号
plt.rc('font',size=14) # 设置图中字号大小
plt.figure(figsize=(15,4))
plt.plot(y,marker='