之前的线性回归具有很大的局限性,它假设我们数据背后存在线性关系,然而实际上更多数据间存在的关系是非线性的。多项式回归方法可以通过非常简单的手段改进线性回归法,使得他们能对非线性数据进行预测。
以上这样的方式,就是所谓的多项式回归。相当于我们为样本多添加了一些特征,这些特征是原来样本的多项式项,增加了这些特征之后,我们可以使用线性回归的思路更好的我们的数据。
编程实现
(1)导入需要的数据集:
import numpy as np
import matplotlib.pyplot as plt
x = np.random.uniform(-3, 3, size=100)
X = x.reshape(-1, 1)
# 一元二次方程
y = 0.5 * x ** 2 + x + 2 + np.random.normal(0, 1, size=100)
plt.scatter(x,y)
plt.show()
图像如图:
(2)使用线性回归进行拟合: