深度学习基础之过拟合



一、基本概念

1) 方差和偏差

  • 偏差:偏差度量了学习算法的期望预测与真实结果的偏离程度, 即刻画了学习算法本身的拟合能力。
  • 方差:方差度量了同样大小的训练集的变动所导致的学习性能的变化, 即刻画了数据扰动所造成的影响。

我们总是希望选择低偏差和低方差的模型,但是偏差和方差在一定程度上是矛盾的。如果偏差降低,那方差可能会相应的升高,如果方差降低,那偏差可能相应升高。所以我们是尽量的寻求偏差和方差的一个平衡点。

下图比较形象的表达偏差和方差的含义:
在这里插入图片描述
可以看到,偏差越大,点集整体越脱离靶心;而方差越大,点集整体越离散。

2) 欠拟合与过拟合

  • 欠拟合(Underfit):也被称为high bias,模型的经验误差大,模型太简单,在训练的过程中基本没学到有价值的内容,说明模型欠拟合。
  • 过拟合(Overfit):也被称为high viarance,模型学习了太多的训练样本的“个性”(经验误差小),但是对于未知的样本泛化能力差(泛化误差大),说明过拟合。

下图比较形象的表达欠拟合和过拟合的含义:
在这里插入图片描述
也可以通过学习曲线来识别模型是否发生了欠拟合、过拟合。

如下图所示:横轴为训练样本数量,纵轴为误差
在这里插入图片描述
模型欠拟合时,在训练集以及测试集上同时具有较高的误差,此时模型的偏差较大;模型过拟合时,在训练集上具有较低的误差,在测试集上具有较高的误差,此时模型的方差较大。模型正常时,在训练集以及测试集上,同时具有相对较低的偏差以及方差。

可以发现:当模型欠拟合的时候,我们发现增大训练集,偏差无法降低,无法解决欠拟合问题;当模型过拟合的时候,我们发现增大训练集,方差减小,可以解决过拟合问题。

3) 经验风险和结构风险

  • 经验误差:模型关于训练样本集的平均误差(也称经验风险)。
  • 结构风险:结构风险在经验风险的基础上加上表示模型复杂度的正则化项。

虽然可以使用经验损失近似估计期望风险,但是大数定理的前提是N无穷大,实际上,我们的训练集一般不会特别大,此时就需要对经验风险做出适当调整才能近似估计。因此引入结构风险。
结构化风险是为了缓解数据集过小而导致的过拟合现象,其等价于正则化,本质上反应的是模型的复杂度。认为经验风险越小,参数越多,模型越复杂,因此引入对模型复杂度的惩罚机制。公式如下:
R ( f ) = 1 n ∑ i = 1 n L ( y i ,

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值