曲线拟合问题的目标是 根据给定的数据集(x,y)预测未知数据x的y,其本身可以归结为最小化误差函数问题。以概率的观点考察曲线拟合,可以更加深刻地理解误差函数以及正则化。
我们看曲线拟合的最小二乘解 。如果样本维数很高,或者样本数目不够多,那么是不可逆的,就会造成过拟合。一般来 说,为了减少过拟合,我们可以增加数据量,对数据进行降维,或者是使用正则化来对w进行约束。
使用正则化方法,则loss function 就会变成 。 常用的正则化有两种,L1(lasso)或者L2(ridge,岭回归,权重衰减)。 以L2 为例, ,展开后关于W求导,并令导数为0