【深度学习】03-02-为什么用了验证集结果还是过拟合了？（选修）-李宏毅老师21&22深度学习课程笔记

最新推荐文章于 2023-10-15 21:41:16 发布

暖焱

最新推荐文章于 2023-10-15 21:41:16 发布

阅读量461

点赞数 1

分类专栏： # 深度学习-李宏毅

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/guai7guai11/article/details/125389118

版权

深度学习人工智能机器学习

深度学习-李宏毅专栏收录该内容

18 篇文章 22 订阅

订阅专栏

为什么用了验证集结果还是过拟合了？（选修）

总结
验证集 - 可看作评估模型的训练
为什么用了验证集结果还是过拟合了？- 验证集要筛选的模型太多

总结

为什么用了验证集结果还是过拟合了？

将验证集挑选model的过程其看作是一种在validation data上的training。如果验证集上要挑选的模型很多，就可能导致过拟合。

验证集 - 可看作评估模型的训练

首先，在training data上训练模型，找到使损失值最小的最优模型参数。
其次，在validation data上评估模型，找到使损失值最小的最优模型参数。
最后，在testing data上使用模型，使用testing data近似all data。
在这里插入图片描述

在这里插入图片描述

用验证集来挑选model的过程其实也可以看作是一种在validation data上的training。

为什么用了验证集结果还是过拟合了？- 验证集要筛选的模型太多

上图例子中，参数h只有三个选择，即 $\mathcal H_{val}={h_1^*,h_2^*,h_3^*} ，|\mathcal H_{val}|=3$ 。基于这种想法，可以进一步分析为什么用了验证集结果还是过拟合了？

在这里插入图片描述

回顾：如果选择的training data不好，理想损失和现实损失就会很大，选择到不好的training data的概率上限值如下图所示。如果模型的参数可能值个数很多，即 $|\mathcal H|$ 很大，或者training data中样本的个数很少，那么概率上限就很大，取到不好的training data的概率就会很大。

若神经网络设计的参数很多， $|\mathcal H_{val}|$ 很大，就会导致取到不好的training data的概率就会很大，理想损失和现实损失差距就会很大。

结论：将验证集挑选model的过程其看作是一种在validation data上的training。如果验证集上要挑选的模型很多，就可能导致过拟合。

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
【深度学习】03-02-为什么用了验证集结果还是过拟合了？（选修）-李宏毅老师21&22深度学习课程笔记

【深度学习】03-02-为什么用了验证集结果还是过拟合了？（选修）-李宏毅老师21&22深度学习课程笔记
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。