多项式回归
若我们需要寻找的不是直线(超平面),而是由多项式所表达的曲线(超曲面),多项式回归的方程可以表达为如下形式:
实战-sklearn
步骤一:导库、导数据
import numpy as np
import matplotlib.pyplot as plt
from sklearn.preprocessing import PolynomialFeatures
from sklearn.linear_model import LinearRegression
data = np.genfromtxt("job.csv", delimiter=",")
x_data = data[1:,1]
y_data = data[1:,2]
步骤二:修改参数维度、拟合模型
此处的degree用来修改参数:
degree=1,在x_data左侧增加一列常数项1
degree=2,在x_data右侧增加一列x^2项
以此类推,具体如下所示:
x_data = x_data[:,np.newaxis]
y_data = y_data[:,np.newaxis]
# 线性模型
model = LinearRegression()
model.fit(x_data, y_data)
# 多项式模型
# 定义多项式回归,degree的值可以调节多项式的特征
poly_reg = PolynomialFeatures(degree=5)
# 特征处理
x_poly = poly_reg.fit_transform(x_data)
# 定义回归模型
lin_reg = LinearRegression()
# 训练模型
lin_reg.fit(x_poly, y_data)
步骤三:可视化
# 画图
plt.plot(x_data, y_data, 'b.')
plt.plot(x_data, lin_reg.predict(poly_reg.fit_transform(x_data)), c='r')
plt.title('Truth or Bluff (Polynomial Regression)')
plt.xlabel('Position level')
plt.ylabel('Salary')
plt.show()
这是我学习 覃秉丰老师的《机器学习算法基础》的自学笔记,课程在B站中的地址为:机器学习算法基础-覃秉丰_哔哩哔哩_bilibili