过拟合和欠拟合_NG-欠拟合、过拟合笔记汇总-CSDN博客

本文链接：https://blog.csdn.net/weixin_39940688/article/details/111341704

1、欠拟合、过拟合

图中第三个是一个包含5阶多项式模型，对训练数据差点完美拟合。

模型一没有非常好的拟合训练数据，在训练数据以及在测量数据上都存在较大误差。这样的情况称之欠拟合（underfitting）。

模型二对训练数据拟合的非常不错，可是在训练数据上的精确度并不理想。这样的对训练数据拟合较好，而在测试数据模型精确度较低，称之为过拟合（overfitting）。

2、局部加权线性回归（locally weighted linear regression，LWR）

从上面欠拟合和过拟合的样例中我们能够体会到，在回归预测模型中，预测模型的精确度特别依赖于特征的选择，特征选择不合适，往往会导致预测结果的天差地别，局部加权线性回归非常好的攻克了问题，它的预测行能不太依赖选择的特征，又能非常好的避免欠拟合和过拟合的风险。

在理解局部加权线性回归前，先回顾一个线性回归。

线性回归的损失函数把训练数据中的样本看作平等的，并没有权重的概念。

而局部加权线性回归，在构造损失函数时增加权重w，对距离预测点较近的训练样本给以较高的权重，距离预测点较远的训练样本给较小的权重。权重的取值范围是（0，1）。

局部加权线性回归的主要思想是：

当中如果权重w(i)的公式：

公式中权重大小取决于预测点x于训练样本X_i的距离，假设｜X_i - X｜较小，那么取值接近于1，反之接近0.参数T称为bandwidth，用于控制权重的变化幅度。

局部加权线性回归是非参数学习算法，损失数随着预测值的不同而不同，这样θ无法事先确定。每次预測时都须要扫描全部数据又一次计算θ，所以计算量比較大。

3、原因分析

（1）模型不能很好拟合数据的原因：

（2）欠拟合的原因：

（3）过拟合的原因：

模型过于复杂，学习到了数据中不无关紧要的东西，把一些无关的东西也学习到了；
为了解决这一问题，可以尝试另一种更简单的模型；或者更常用的是，使用生成过拟合的原始算法，但在算法中增加了正则化项，即对过于复杂的模型进行附加处理，从而引导算法在拟合数据的同时生成一个不太复杂的模型；

4、怎样判断过拟合和欠拟合？

5、如何解决过拟合和欠拟合？

（1）防止过拟合的方法：

模型的复杂度可用VC维来衡量。通常情况下，模型VC维与系数w的个数成线性关系：即w数量越多，VC维越大，模型越复杂。因此，为了限制模型的复杂度，很自然的思路是减少系数w的个数，即让w向量中的一些元素为0或者说限制w中非零元素的个数；

故可以在原优化问题中加入一个约束条件：

||.||0范数表示向量中非零元素的个数。为了方便求解，可是适当放松下条件，不严格要求某些权重w为0，而是要求权重w接近于0，即尽量小。从而用L1、L2范数来近似L0范数，即：

使用L2范数时，为方便后续处理，可对||w||2进行平方处理，同时调整C的取值。

6、l1和l2正则有什么区别？

第一，L1正则化等价于在原优化目标函数中增加约束条件

L2正则化等价于在原优化目标函数中增加约束条件

第二，L1正则化会趋向于产生少量的特征，而其他特征都是0，L2正则化会选择更多的特征，这些特征都会趋向于0；

7、L1损失函数、L2损失函数的特点

注：其中某些概念有参考其他博主回答，时间太久了找不到出处，入侵删。