关于深度学习中泛化的几个概念

泛化

过拟合

将模型在训练数据上拟合得⽐在潜在分布中更接近的现象称为过拟合(overfitting),⽤于对抗过拟合的技术 称为正则化(regularization)。

训练误差和泛化误差

训练误差(training error)是指,我们的模 型在训练数据集上计算得到的误差。泛化误差(generalization error)是指,当我们将模型应⽤在同样从原 始样本的分布中抽取的⽆限多的数据样本时,我们模型误差的期望。

独立同分布假设
模型复杂性

当我们有更复杂的模型和更少的 样本时,我们预计训练误差会下降,但泛化误差会增⼤。

影响泛化的因素
  1. 可调整参数的数量。当可调整参数的数量(有时称为⾃由度)很⼤时,模型往往更容易过拟合。
  2. 参数采⽤的值。当权重的取值范围较⼤时,模型可能更容易过拟合。
  3. 训练样本的数量。即使你的模型很简单,也很容易过拟合只包含⼀两个样本的数据集。而过拟合⼀个有 数百万个样本的数据集则需要⼀个极其灵活的模型。
K折交叉验证
欠拟合和过拟合

训练误差和验证误差都很严重,如果模型不能降低训练误差,则欠拟合

当我们的训练误差明显低于验证误差,则过拟合

数据集大小

越多的数据,越能拟合一个更复杂的模型,复杂的模型可能是有益的,但如果没有足够的数据,简单的模型可能更有用

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值