深度学习网络不收敛？网络输出全为零？应该如何检查？

最新推荐文章于 2024-04-24 13:30:10 发布

VIP文章 Xinyu_cheng

最新推荐文章于 2024-04-24 13:30:10 发布

阅读量1.3w

点赞数 15

文章标签：深度学习网络训练模型检查不收敛

此文章版权归Xinyu_cheng所有, 若有参考，烦请标注

本文链接：https://blog.csdn.net/xinyu_cheng/article/details/100637459

版权

引言

已经有人作出了相应的文章详细分析，具体可参考：37 Reasons why your Neural Network is not working，这篇文章主要从四个方面进行探讨：数据集制作、数据归一化-数据增强、网络实现、网络训练，当你对自己的网络无从下手时或一直因为网络模型不收敛而心烦意乱时，也许这篇文章可以帮助到你。

前提

网络训练了至少12小时。其中可以看到梯度变化，损失下降的现象。但是当你查看模型效果的时候，以pixel级别的FCN为例，你发现模型输出全为0或者很接近于0的值，此时说明你训练的网络模型正在输出垃圾，此时应该怎么做呢？

本文对上面提到的文章进行翻译，并加入自己的见解，希望能帮到你。

1.数据集检查

（1）检查输入数据
在网络输入前面进行检查，看数据输入是否正确。例如在做图片处理的时候，是否弄清了图像的高度和宽度，opencv和PIL数据读取的方式是不一样的，opencv是BGR读取，而PIL是RGB读取，色彩通道顺序不一样，还有就是ground_truth的时候一定得注意x，y是否正确对应图像的高和宽。此时可打印或显示若干批量的网络输入和目标输出，确保他们是正确的。

（2）尝试随机数入
尝试传递随机数而不是真是数据，看看错误产生的方式是否想同。如果是，说明在某些时候网络吧数据化为了垃圾，此时可尝试逐层调试，并查看出错的地方。

（3）检查数据加载器
原始数据或许很好，但是数据预处理传输到网络过程中的代码可能有问题，在网络输入前应该打印第一层的输入并仔细检查。

（4）确保输入与输出关联
检查少许输入样本是否有正确的标签，同样也确保shuffle输入样本同样对输出标签有效。

（5）输入与输出之间的关系是否太随机？
如何看待随机呢，好比训练一个网络预测随

最低0.47元/天解锁文章

关注

15
点赞
踩
90

收藏

觉得还不错? 一键收藏
4
评论
深度学习网络不收敛？网络输出全为零？应该如何检查？

引言已经有人作出了相应的文章详细分析，具体可参考：37 Reasons why your Neural Network is not working，这篇文章主要从四个方面进行探讨：数据集制作、数据归一化-数据增强、网络实现、网络训练，当你对自己的网络无从下手时或一直因为网络模型不收敛而心烦意乱时，也许这篇文章可以帮助到你。前提网络训练了至少12小时。其中可以看到梯度变化，损失下降的现象。...
复制链接

扫一扫

Xinyu_cheng CSDN认证博客专家 CSDN认证企业博客

码龄5年

15: 原创

14万+: 周排名

99万+: 总排名

5万+: 访问

: 等级

819: 积分

17: 粉丝

49: 获赞

96: 评论

346: 收藏

私信

关注

热门文章

分类专栏

环境部署 1篇

最新评论

Pytorch版Faster R-CNN训练自己数据集
Sycomore: 进去源码以后都是报错也可以运行吗进去改了好几天发现好多凭空引用的东西
深度学习数据增强（Data Augmentation）--VOC数据集
未来光: 我也遇到了这个问题，我看了一下，只有最后250张被增强了20次
深度学习数据增强（Data Augmentation）--VOC数据集
未来光: 原来数据集的xml文件里面有中文
深度学习网络不收敛？网络输出全为零？应该如何检查？
Cleo_Gao: 因为你没存呀，调用 torch.save() 存下来
Faster R-CNN模型工程部署（pytorch）
谢意金: File "run_pytorch_server.py", line 150, in load_model raise Exception('There is no input directory for loading network from ' + input_dir) Exception: There is no input directory for loading network from ./models/res101/pascal_voc 你好，这个模型去哪找啊

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。