神经网络最优化方法总结比较

最新推荐文章于 2024-06-06 20:29:46 发布

Muzi_Water

最新推荐文章于 2024-06-06 20:29:46 发布

阅读量3.6k

点赞数 1

分类专栏：深度学习

本文链接：https://blog.csdn.net/Muzi_Water/article/details/81453491

版权

参考：深度学习最全优化方法总结比较（SGD，Adagrad，Adadelta，Adam，Adamax，Nadam）学习率方法缺点优点经验手动设置学习率 SGD(mini-batch gradient descent) 选择合适的learning rate比较困难 - 对所有的参数更新使用同样的learning rate。对于稀疏数据或者特征，有...

摘要由CSDN通过智能技术生成

参考：深度学习最全优化方法总结比较（SGD，Adagrad，Adadelta，Adam，Adamax，Nadam）

学习率	方法	缺点	优点	经验
手动设置学习率	SGD(mini-batch gradient descent)	选择合适的learning rate比较困难 - 对所有的参数更新使用同样的learning rate。对于稀疏数据或者特征，有时我们可能想更新快一些对于不经常出现的特征，对于常出现的特征更新慢一些，这时候SGD就不太能满足要求了	初始化和学习率设置比较合适的情况下，结果更可靠

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Muzi_Water

关注关注

1
点赞
踩
23

收藏

觉得还不错? 一键收藏
0
评论
神经网络最优化方法总结比较

参考：深度学习最全优化方法总结比较（SGD，Adagrad，Adadelta，Adam，Adamax，Nadam）学习率方法缺点优点经验手动设置学习率 SGD(mini-batch gradient descent) 选择合适的learning rate比较困难 - 对所有的参数更新使用同样的learning rate。对于稀疏数据或者特征，有...
复制链接

扫一扫