过拟合及其解决方法
偏频派与贝叶斯派
偏频派
偏频派认为一个模型的参数是固定的,通过给定的数据可以求解出一个固定的值。比较常使用的参数估计方法是最大似然估计。
贝叶斯派
贝叶斯派则认为模型的参数都是不确定的,我们可以使用概率论的知识去描述参数的不确定性。比较常用的参数估计方法是最大后验估计。
过拟合的定义
定义:目标函数在训练数据集上拟合得很好,但在测试数据集上效果很差。
如上图所示,上面的两张图拟合度不够,这被称为欠拟合。与之相反,右下图完美地拟合了每一个训练数据,但是拟合出的曲线和真实的曲线差别却很大。左下角的图比较好地拟合训练数据,但不是完美拟合,但它拟合出的曲线很接近真实曲线。
其中 w<