基础理解:
之前我们提到过多元线性回归,多元线性回归指的是每一个特征与目标值(y)呈线性关系,但多项式回归指的是样本特征与目标值(y)呈非线性关系,例如:y = ax^2 + bx + c,其中x^2可以看做是人为添加的另一个特征。
从而我们也可以得出多项式回归的操作步骤:在现有的模型基础上加上x^2,然后后面的操作便和线性回归中实现的一样。
线性回归传送门
多项式回归是对线性回归算法的改进,使得能够处理非线性的问题,做出相应的预测,因为线性回归算法假设的是数据之间呈线性关系,但是在实际的生产活动中,具有严格的线性关系的数据相对较少,更多的时候是呈非线性关系。
应用多项式回归解决问题:
①模式并查看数据集的分布情况
import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
x = np.random.uniform(-3,3,size=100)
X = x.reshape(-1,1)
y = 0.5 * x**2 + x * 2 + np.random.normal(0, 1, size=100)
plt.scatter(x,y)
plt.show()
②进行线性回归
from