8-3 过拟合和欠拟合

最新推荐文章于 2024-06-24 20:42:40 发布

Bonjour_Yvonne

最新推荐文章于 2024-06-24 20:42:40 发布

阅读量131

点赞数

分类专栏：机器学习文章标签：机器学习

本文链接：https://blog.csdn.net/Bonjour_h/article/details/117222266

版权

机器学习专栏收录该内容

36 篇文章

订阅专栏

import numpy as np
import matplotlib.pyplot as plt

np.random.seed(666)
x = np.random.uniform(-3.0,3.0,size=100)
X = x.reshape(-1,1)
y = 0.5 * x ** 2 + x + 2 + np.random.normal(0,1,size=100)

plt.scatter(x,y)
plt.show()

输出图片：在这里插入图片描述
使用线性回归

from sklearn.linear_model import LinearRegression

lin_reg = LinearRegression()
lin_reg.fit(X,y)
lin_reg.score(X,y)
输出：0.4953707811865009

y_predict = lin_reg.predict(X)
plt.scatter(x,y)
plt.plot(np.sort(x),y_predict[np.argsort(x)],color='r')
plt.show()

输出图片：
在这里插入图片描述

from sklearn.metrics import mean_squared_error#使用均方误差来进行衡量

y_predict = lin_reg.predict(X)#我们训练出来的模型LinearRegression对于X的预测结果
mean_squared_error(y,y_predict)#使用线性拟合最终得到的均方误差
输出：3.0750025765636577

用直线来拟合数据，显然没有很好的反应原始数据的样本特征，这种情况叫做欠拟合
在这里插入图片描述

使用多项式回归

from sklearn.pipeline import Pipeline
from sklearn.preprocessing import PolynomialFeatures
from sklearn.preprocessing import StandardScaler

def PolymialRegression(degree):
    return Pipeline([
        ("poly",PolynomialFeatures(degree=degree)),
        ("std_scaler",StandardScaler()),
        ("lin_reg",LinearRegression())
    ])
    
poly2_reg = PolymialRegression(degree=2)
poly2_reg.fit(X,y)

Pipeline(steps=[('poly', PolynomialFeatures()),
                ('std_scaler', StandardScaler()),
                ('lin_reg', LinearRegression())])
y2_predict = poly2_reg.predict(X)
mean_squared_error(y,y2_predict)

输出：1.0987392142417856

plt.scatter(x,y)
plt.plot(np.sort(x),y10_predict[np.argsort(x)],color='r')
plt.show()

输出图片：
在这里插入图片描述
将degree的值放大再来看结果：

poly100_reg = PolymialRegression(degree=100)
poly100_reg.fit(X,y)
y100_predict = poly100_reg.predict(X)
mean_squared_error(y,y100_predict)
输出：0.6870911922673567

plt.scatter(x,y)
plt.plot(np.sort(x),y100_predict[np.argsort(x)],color='r')
plt.show()

输出图片：
在这里插入图片描述

X_plot = np.linspace(-3,3,100).reshape(100,1)
y_plot = poly100_reg.predict(X_plot)

plt.scatter(x,y)
plt.plot(X_plot[:,0],y_plot,color='r')
plt.axis([-3,3,-1,10])
plt.show()