深度学习（进阶）- 毒丹师的一些炸炉心得

最新推荐文章于 2024-10-11 21:03:22 发布

玄学关门大弟子

最新推荐文章于 2024-10-11 21:03:22 发布

阅读量318

点赞数

分类专栏：深度学习文章标签：深度学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41994220/article/details/114998357

版权

深度学习专栏收录该内容

6 篇文章 0 订阅

订阅专栏

开始测试程序时，最好用Adam优化器，SGD优化器虽然到后期在参数调好的情况下会比Adam优化器效果好，但是SGD的速度慢，在初期验证是否程序能实现需求的时候，一般选Adam会好点，这样不至于速度过慢，收敛状态也不会太差。
当batchsize增大时，一般也需要适当的增大学习率，但两者也不宜过大。具体调参情况，取决于你个人的经验积累和工程实践需求了。
当你所跑的实验不对劲时，首先检测数据集的数据读入、处理、读出是否有误；然后检查你的代码是否有逻辑错误；接着将你设计的网络替换成已经成熟的网络，看是否正常；最后检查各种超参数是否合适。
当测试设计的网络是否能够对数据集正常学习时，首先在训练的时候给少量的数据集让模型过拟合，并在这个过程中调节超参数，如果模型能够过拟合，那么在送入全部数据集进行训练。
模型训练的过程中，loss震荡是正常的，只要下降的大趋势正常，那就没问题。如果loss下降震荡的厉害，可以检查一下是不是batchsize太小了；有些极端的震荡也是有问题的，比如突然有一个epoch的loss急剧上升，下一个epoch就降回来了，这个可能是你数据集有一个较大的离散样本，你可以找到它并删掉它，或者也可以在loss里面进行编程过滤。
待补充，这种东西不遇上一下子还真的是难想到啊。

玄学关门大弟子

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

玄学关门大弟子

博客等级

码龄7年

29
原创

61
点赞

481
收藏

37
粉丝

关注

私信

热门文章

分类专栏

最新评论

利用Q-learning解决Cliff-walking问题
cjdjl: 大佬您好，请问能给一些你在模型搭建时候参考的文献吗？
基于python实现单目三维重建
Fan_nan_chi: 降cv版本呀老哥
基于python实现单目三维重建
妫赟: 因为专利问题opencv把SURF算法部分给删了，然后就报错了
基于python实现单目三维重建
妫赟: 感谢分享，明人不说暗话，我抄走当作业交了，哥哥
基于python实现单目三维重建
玄学关门大弟子: 这个是我初学时的一个demo，肯定很多不完善的地方，忘大家见谅蛤。另外，会存在一些小伙伴们问一些相关问题，我表示简单的还能扯扯，难的就不会了（主要是project太久了，而且，我早就换研究方向了）

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。