训练神经网络时，训练集loss下降，但是验证集loss一直不下降

最新推荐文章于 2024-06-29 16:53:05 发布

深度瞎学

最新推荐文章于 2024-06-29 16:53:05 发布

阅读量1.8w

点赞数 6

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44438120/article/details/107513046

版权

深度学习专栏收录该内容

35 篇文章 5 订阅

订阅专栏

可以判定问题的原因来自两方面，一方面是模型过拟合，另一方面是训练集和测试机的数据域不同。

一、问题定位：

至于问题的定位排查，建议按照先易后难的角度，也就是先排查训练集和测试集是否存在数据域的不同，再排查模型是否过拟合。

1.关于数据域的排查

具体来讲就是查验训练集和测试集的数据分布不一致，具体来说有如下几点

（1）数据源分布不一样：例如在图像处理中，训练集的图像采集使用的是摄像头A拍摄的，而测试集是摄像头B拍摄的，但是摄像头A和B的拍摄效果差别较大（例如：图像成图的清晰度、对比度等）；在语音识别中，训练集是音频普通话较多，测试集却很多方言；

（2）数据集的噪声干扰不同：例如在图像中，训练集的图像都是正常拍摄，但是测试集的图像都是昏暗的或遮挡的；在语音识别中，训练集可能都是清晰的音频，测试集却有很多背景杂音等。

2.关于过拟合的排查

如果不是数据域的问题，那么可以基本判定训练集和测试集的数据域是一致的。那么问题可以归为模型过拟合。

二、问题对应的解决方案

1）数据域问题的解决方式

重新编排训练集和测试集的数据组成比例，尽量做到数据在训练集和测试集上分布是一致的。

2）过拟合问题的解决方式

针对过拟合问题，一般是从数据增广和模型复杂度两个角度去处理。

（1）在数增广上，尽量在训练时增加一些在线增广的策略，例如，图像处理中，增加图像的扭曲、噪声点、扭曲、模糊等。

（2）在模型复杂度上，可以适当的增加些dropout、normal等操作，或者增减一些网络层数和数据加权等。

参考链接：
知乎回答

关注

6
点赞
踩
55

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

深度瞎学 CSDN认证博客专家 CSDN认证企业博客

码龄6年

59: 原创

24万+: 周排名

98万+: 总排名

24万+: 访问

: 等级

1913: 积分

27: 粉丝

219: 获赞

55: 评论

781: 收藏

私信

关注

热门文章

分类专栏

最新评论

RT-DETR个人整理向理解
深度瞎学: 我个人觉得是没太大关系的，原来的DETR网络里面是没有IOU-aware这个的，我觉得RT-DETR加这个可能是为了更快收敛之类的。具体你可以看一下李沐老师的DETR的讲解，然后再回过头来看RT-DETR。
RT-DETR个人整理向理解
噗叽开车车: 博主我想问一下IoU-aware和object query的初始化有什么关系吗，我不太理解论文中的这一点
RT-DETR个人整理向理解
村口祖传点云小王子: 是的，yolov8官方代码里的是这样写的
RT-DETR个人整理向理解
深度瞎学: 你可以看一下我这里面HybridEncoder的图，或者你看一下原文fig.3的图。看看是不是你想要的答案。我个人理解是AIFI使用S5得到F5然后CCFM将S4、S3和F5做fusion，但是fig.5那个图这么去画不太好画就直接将3、4、5一起画里面了。但是也是加了一个总体框框的。我是这么理解的不知道对不对。
RT-DETR个人整理向理解
村口祖传点云小王子: 对照组e在代码中只有s5一个输入，在图5中，所有对照组有3个输入。这三个输入没有看懂。。。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。