【深度学习】03-02-为什么用了验证集结果还是过拟合了?(选修)-李宏毅老师21&22深度学习课程笔记

总结

为什么用了验证集结果还是过拟合了?

将验证集挑选model的过程其看作是一种在validation data上的training。如果验证集上要挑选的模型很多,就可能导致过拟合。

验证集 - 可看作评估模型的训练

首先,在training data上训练模型,找到使损失值最小的最优模型参数。
其次,在validation data上评估模型,找到使损失值最小的最优模型参数。
最后,在testing data上使用模型,使用testing data近似all data。
在这里插入图片描述

在这里插入图片描述

用验证集来挑选model的过程其实也可以看作是一种在validation data上的training。

为什么用了验证集结果还是过拟合了?- 验证集要筛选的模型太多

上图例子中,参数h只有三个选择,即 H v a l = h 1 ∗ , h 2 ∗ , h 3 ∗ , ∣ H v a l ∣ = 3 \mathcal H_{val}={h_1^*,h_2^*,h_3^*} ,|\mathcal H_{val}|=3 Hval=h1,h2,h3Hval=3。基于这种想法,可以进一步分析为什么用了验证集结果还是过拟合了?

在这里插入图片描述

回顾:如果选择的training data不好,理想损失和现实损失就会很大,选择到不好的training data的概率上限值如下图所示。如果模型的参数可能值个数很多,即 ∣ H ∣ |\mathcal H| H很大,或者training data中样本的个数很少,那么概率上限就很大,取到不好的training data的概率就会很大。

若神经网络设计的参数很多, ∣ H v a l ∣ |\mathcal H_{val}| Hval很大,就会导致取到不好的training data的概率就会很大,理想损失和现实损失差距就会很大。

结论:将验证集挑选model的过程其看作是一种在validation data上的training。如果验证集上要挑选的模型很多,就可能导致过拟合。

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值