网络模型不收敛的可能原因

dlvector

已于 2022-03-28 01:04:48 修改

阅读量659

点赞数

分类专栏：深度学习文章标签： python 图像识别 c++

于 2022-03-28 01:03:28 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/github_38148039/article/details/123784496

版权

深度学习专栏收录该内容

20 篇文章 0 订阅

订阅专栏

检查输入数据是否正常。是否有异常数据（全部是零，gt不对）
是否归一化数据
与预训练模型原来的输入标准是否一致。
数据预处理是否正确
简单化自己的问题。
检查自己的损失函数
检查损失的输入
检查自定义的网络层
检查冻结层的设置
检查维度信息是否匹配
梯度回传检查
检查模型初始化参数
超参数的设置是否合理
减少正则化
训练模式和测试模式的相互转换
可视化 (权重，激活函数，权重直方图，层的更新）
使用不同的优化器
梯度爆炸和梯度消失（查看梯度的值）
调节学习率的大小（和权重应该是数量级的差异，权重0.1，学习率0.001）
NaN值（降低学习率，观察是否有除以0/small的操作,检查NaN出现的第一个位置，调整激活函数）

reference

M：37 Reasons why your Neural Network is not working
What is the “dying ReLU” problem in neural networks?
模型训练时loss不收敛、不下降原因和解决办法

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
网络模型不收敛的可能原因

检查输入数据是否正常。是否有异常数据（全部是零，gt不对）是否归一化数据与预训练模型原来的输入标准是否一致。数据预处理是否正确简单化自己的问题。检查自己的损失函数检查损失的输入检查自定义的网络层检查冻结层的设置检查维度信息是否匹配梯度回传检查检查模型初始化参数超参数的设置是否合理减少正则化训练模式和测试模式的相互转换可视化 (权重，激活函数，权重直方图，层的更新）使用不同的优化器梯度爆炸和梯度消失（查看梯度的值）调节学习率的大小（和权重应该是数量级的差异，权重0.1，学.
复制链接

扫一扫

专栏目录

dlvector CSDN认证博客专家 CSDN认证企业博客

码龄7年

142: 原创

5万+: 周排名

114万+: 总排名

27万+: 访问

: 等级

2792: 积分

79: 粉丝

205: 获赞

34: 评论

902: 收藏

私信

关注

热门文章

分类专栏

Cpp 35篇
深度学习 20篇
竞赛项目 4篇
python 4篇
传统图像处理 22篇
数学 5篇
统计与ML 7篇
红外 4篇
光学 6篇
笔记 2篇
job 1篇
技术栈 38篇
刷题周赛 9篇
网课学习 23篇
动作识别/视频理解 1篇

最新评论

竞赛回顾:脊柱疾病智能诊断大赛
m0_65231057: 博主您好，想问一下这个程序是CPU还是GPU类型的啊
mmdection入门
小徐爱打球: 视频在哪里可以找到
视场光阑与孔径光阑
Late~wind: 视场光阑变小时，其成像范围变小，但成像物点的孔径角不会发生变化。成像范围的缩小是因为视场光阑限制了通过光学系统的光线数量，从而导致成像范围的缩小。
光学：数值孔径
woa822: NA=sqrt(n1^2-n2^2)
竞赛回顾:脊柱疾病智能诊断大赛
shendu__123: 博主您好，请问您的方案有放在github上吗，可以学习一下您的代码思想吗，这对我的毕业至关重要，非常感谢！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。