使用最小二乘法拟合曲线并对过拟合进行正则化处理
引言
高斯于1823年在误差𝑒1,…,𝑒𝑛独立同分布的假定下,证明了最小二乘法的一个最优性质:在所有无偏的线性估计类中,最小二乘方法是其中方差最小的!
对于数据(𝑥𝑖,𝑦𝑖)(𝑖=1,2,3…,𝑚),拟合出函数ℎ(𝑥)有误差,即残差:𝑟𝑖=ℎ(𝑥𝑖)−𝑦𝑖,此时𝐿2范数(残差平方和)最小时,ℎ(𝑥)和 𝑦相似度最高,说明两者最具有拟合性。
一般的𝐻(𝑥)为𝑛次的多项式,
H ( x ) = w 0 + w 1 x + w 2 x 2 + ⋯ + w n x n H(x)=w_0+w_1 x+w_2 x^2+⋯+w_n x^n H(x)=w0+w1x+w2x2+⋯+