深度学习中网络在训练时不收敛的原因

最新推荐文章于 2023-04-06 14:42:19 发布

Tom Hardy

最新推荐文章于 2023-04-06 14:42:19 发布

阅读量3.9k

点赞数 1

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_29462849/article/details/97136790

版权

深度学习专栏收录该内容

113 篇文章 53 订阅

订阅专栏

介绍

前段时间在做training的时候，发现网络会有的时候不收敛，于是仔细去查看了网络不收敛的原因，在此做个记录。

网络不收敛的原因

一、数据和标签

需要查看数据分类标注是否准确？数据是否干净？数据库太小一般不会带来不收敛的问题，只要你一直在train总会收敛。反而不收敛一般是由于样本的信息量太大导致网络不足以fit住整个样本空间。样本少只可能带来过拟合的问题。

二、学习率设定不合理

在自己训练新网络时，可以从0.1开始尝试，如果loss不下降的意思，那就降低，除以10，用0.01尝试，一般来说0.01会收敛，不行的话就用0.001. 学习率设置过大，很容易震荡。不过刚刚开始不建议把学习率设置过小，尤其是在训练的开始阶段。

在开始阶段我们不能把学习率设置的太低否则loss不会收敛。我的做法是逐渐尝试，从0.1,0.08,0.06,0.05 …逐渐减小直到正常为止

三、网络设定不合理

如果做很复杂的分类任务，却只用了很浅的网络，可能会导致训练难以收敛，换网络即可(我从yolov2换成了yolov3），或者也可以尝试加深当前网络。

关注

1
点赞
踩
19

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Tom Hardy

CSDN认证博客专家 CSDN认证企业博客

码龄9年

450: 原创

1万+: 周排名

84万+: 总排名

303万+: 访问

: 等级

2万+: 积分

2917: 粉丝

2585: 获赞

1753: 评论

2万+: 收藏

私信

关注

热门文章

分类专栏

3D视觉 6篇
人工智能 10篇
自动驾驶 7篇
学术分享 1篇
tensorflow 2篇
ACM
opencv实战 4篇
C++ 7篇
机器学习 39篇
深度学习 113篇
python 12篇
计算机视觉 48篇
kaggle实战 5篇
数据挖掘 2篇
Data Science 1篇
深度学习框架 3篇
算法之美 26篇
生活感悟 4篇
Matlab 1篇
LeetCode 60篇
PCL点云处理 12篇
项目实战 16篇
剑指offer 42篇

最新评论

3D点云目标检测算法汇总
2301_77937181: 不推荐这篇，很久不全
开放集合目标检测任务 Open-set Detection
@爱编程的郭同学: 你好，请问你有这个论文的代码嘛
基于分割的PTD渐进三角网加密滤波（SBF）算法
冰城孤雁: 效果最好的还是渐进三角网，如果只是想让地面点完整ptd方法是可以做到的，但是dem不仅仅是完整就可以了，还要保证光滑度，显然其它分类方法很难兼顾这两个特点，所以改良的 ptd方法才是正道，其它方法只能作为一种辅助改进手段，个人愚见不一定对
实践教程｜YOLOX目标检测ncnn实现
wj123123...: 为什么我转是这样的
实践教程｜YOLOX目标检测ncnn实现
wj123123...: Split splitncnn_input0 1 2 images images_splitncnn_0 images_splitncnn_1 Crop /backbone/backbone/stem/Slice 1 1 images_splitncnn_1 /backbone/backbone/stem/Slice_output_0 -23309=1,0 -23310=1,2147483647 -23311=1,1 Split splitncnn_0 1 2 /backbone/backbone/stem/Slice_output_0 /backbone/backbone/stem/Slice_output_0_splitncnn_0 /backbone/backbone/stem/Slice_output_0_splitncnn_1 Crop /backbone/backbone/stem/Slice_1 1 1 /backbone/backbone/stem/Slice_output_0_splitncnn_1 /backbone/backbone/stem/Slice_1_output_0 -23309=1,0 -23310=1,2147483647 -23311=1,2 Crop /backbone/backbone/stem/Slice_2 1 1 /backbone/backbone/stem/Slice_output_0_splitncnn_0 /backbone/backbone/stem/Slice_2_output_0 -23309=1,1 -23310=1,2147483647 -23311=1,2 Crop /backbone/backbone/stem/Slice_3 1 1 images_splitncnn_0 /backbone/backbone/stem/Slice_3_output_0 -23309=1,1 -23310=1,2147483647 -23311=1,1 Split splitncnn_1

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。