卷积神经网络调参之学习率

最新推荐文章于 2024-06-24 11:38:01 发布

益达888

最新推荐文章于 2024-06-24 11:38:01 发布

阅读量9.1k

点赞数 4

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_29023939/article/details/80286630

版权

最近在训练一个人脸识别的神经的网络时，经过几十次迭代后，代价函数的值没什么变化。如是百度了一下，看原因是什么。百度上说有可能是学习率过大造成的，我试着将学习率减小到了0.01（原本时0.1），果然有效果，经过几十次迭代后，代价函数的值依然在收敛。这是什么原因呢？下面谈谈我的看法。

我们知道权值代价函数Loss是关于权值W的函数，即Loss(W)。权值的更新公式为：

假设Loss的函数图像如下（实际情况图像更复杂）

如上图所示，代价函数在处求导，然后将导数乘以学习率，假若你的学习率过大，将导致更新完的权值为上图处,此时代价函数的值和处的代价函数的值很接近，而不是理想状态下的。经过下一次迭代权值更新又会回到附近，最后循环往复，代价函数很难收敛。如果学习率过小，会导致权值更新很小，导致代价函数收敛的很慢，模型训练的速度比较慢。

综上所述，在调参时，学习率也是我们要关注的。

关注

4
点赞
踩
11

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。