线性回归欠拟合与过拟合的情况再实际业务中会非常普遍,这时我们需要用到多项式特征的线性回归来逼近非线性函数。如下图我们看degree不同角度下的拟合情况:当角度为1的时候(高斯分布的线性回归)出现欠拟合的情况,当角度为10的时候出现过拟合的情况。
接这用房价与房屋面积这组数据来验证
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
data=pd.DataFrame({
'square_feet':[150,200,230,255,260,340,700,720,790,850,900,950,1000],
'price':[5450,6850,8750,9650,10450,13450<