【网络收敛】如何根据loss判断网络是否收敛

知己不识君

已于 2022-05-28 15:14:45 修改

阅读量1.6w

点赞数 5

分类专栏： pytorch函数文章标签：神经网络深度学习人工智能

于 2022-05-28 15:14:44 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_42745706/article/details/124237478

版权

pytorch函数专栏收录该内容

8 篇文章

订阅专栏

Loss收敛评判标准：
1、一般而言，当loss不再下降，趋于稳定时，就差不多收敛了，就意味着训练可以结束了
2、有的人说0.001以下，但主要看效果

Loss不收敛可能存在的问题：
首先你要保证训练的次数够多，不要以为一百两百次就会一直loss下降或者准确率一直提高，会有一点震荡的。只要总体收敛就行。若训练次数够多（一般上千次，上万次，或者几十个epoch）没收敛，则试试下面方法：

1、数据归一化
神经网络中对数据进行归一化是不可忽略的步骤，网络能不能正常工作，还得看你有没有做归一化，一般来讲，归一化就是减去数据平均值除以标准差，通常是针对每个输入和输出特征进行归一化

2、数据集label的设置
检查lable是否有错，有的时候图像类别的label设置成1，2，3正确设置应该为0,1,2

3、网络设定不合理
如果做很复杂的分类任务，却只用了很浅的网络，可能会导致训练难以收敛，换网络换网络换网络，重要的事情说三遍，或者也可以尝试加深当前网络。

4、数据和标签
数据分类标注是否准确？数据是否干净？数据库太小一般不会带来不收敛的问题，只要你一直在train总会收敛（rp问题跑飞了不算）。反而不收敛一般是由于样本的信息量太大导致网络不足以fit住整个样本空间。样本少只可能带来过拟合的问题

5、学习率设定不合理
在自己训练新网络时，可以从0.1开始尝试，如果loss不下降的意思，那就降低，除以10，用0.01尝试，一般来说0.01会收敛，不行的话就用0.001. 学习率设置过大，很容易震荡。不过刚刚开始不建议把学习率设置过小，尤其是在训练的开始阶段。在开始阶段我们不能把学习率设置的太低否则loss不会收敛。我的做法是逐渐尝试，从0.1,0.08,0.06,0.05 …逐渐减小直到正常为止，

知己不识君

博客等级

码龄7年

46
原创

205
点赞

948
收藏

1万+
粉丝

关注

私信

热门文章

分类专栏

Windows 2篇
opencv 5篇
pytorch 4篇
Python函数学习 6篇
算法与数据结构
pytorch函数 8篇
QT 1篇
Fiddler 1篇
pytorch报错 3篇
python报错 3篇
Python北大陈斌 4篇
Python 7篇
C语言 2篇
Comsol 4篇
Matlab 1篇
C++ 2篇
Tensorflow 1篇

展开全部收起

最新评论

cuda和cudnn下载安装
m0_60430642: 严重性代码说明项目文件行禁止显示状态详细信息错误 MSB3721 命令“"..\..\..\..\..\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.0\bin\nvcc.exe" -gencode=arch=compute_52,code=\"sm_52,compute_52\" --use-local-env -ccbin "C:\Program Files\Microsoft Visual Studio\2022\Professional\VC\Tools\MSVC\14.40.33807\bin\HostX64\x64" -x cu -I"..\..\..\..\..\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.0\include" -I"..\..\..\..\..\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.0\include" -G --keep-dir CudaRuntime11\x64\Debug -maxrregcount=0 --machine 64 --compile -cudart static -g -DWIN32 -DWIN64 -D_DEBUG -D_CONSOLE -D_MBCS -Xcompiler "/EHsc /W3 /nologo /Od /FdCudaRuntime11\x64\Debug\vc143.pdb /FS /Zi /RTC1 /MDd " -o C:\Users\田孜桐\source\repos\CudaRuntime11\CudaRuntime11\x64\Debug\kernel.cu.obj "C:\Users\田孜桐\source\repos\CudaRuntime11\kernel.cu"”已退出，返回代码为 1。 CudaRuntime11 C:\Program Files\Microsoft Visual Studio\2022\Professional\MSBuild\Microsoft\VC\v170\BuildCustomizations\CUDA 12.0.targets 794
QT6.1.2下载和安装教程
墨城烟柳ベ旧人殇: 纯恶心，下三个小时，下载后文件都不见了，垃圾安装教程来祸害人
QT6.1.2下载和安装教程
想想啊啊啊: 为什么我的账户是商务型的啊，怎么改啊
QT6.1.2下载和安装教程
入梦游: 下载安装完了，发现Qt和Qt Creator是两个东东
QT6.1.2下载和安装教程
lin|van: 为什么准备安装的时候显示空间不够(刚好是c盘的剩余空间)，但是指定安装那部分是选的e盘

大家在看

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。