adam算法效果差原因_信电学院本科生提出AI新算法：速度比肩Adam，性能媲美SGD，ICLR领域主席赞不绝口...

最新推荐文章于 2024-04-29 11:18:46 发布

weixin_39747595

最新推荐文章于 2024-04-29 11:18:46 发布

阅读量165

点赞数

文章标签： adam算法效果差原因

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39747595/article/details/112186512

版权

浙江大学和北京大学的两位本科生实习生开发了一种名为AdaBound的神经网络优化算法，该算法在ICLR 2019会议上被收录并受到好评。AdaBound在训练初期具有Adam的高速度，后期则展现出SGD的稳定性，适用于CV和NLP任务，且对超参数不敏感，减少了调参时间。论文中展示了AdaBound在不同模型上的实验结果，证明其优于SGD的训练速度和泛化能力。

摘要由CSDN通过智能技术生成

晓查乾明发自凹非寺
量子位报道 | 转自公众号 QbitAI

两位学霸本科生，一位来自浙大，一位来自北大。

他们在实习期间，研究出一种新的AI算法，相关论文已经被人工智能顶级会议ICLR 2019收录，并被领域主席赞不绝口，完全确定建议接收。

在这篇论文中，他们公布了一个名为AdaBound的神经网络优化算法，简单地说，这个算法训练速度比肩Adam，性能媲美SGD。

这个算法适用于CV、NLP领域，可以用来开发解决各种流行任务的深度学习模型。而且AdaBound对超参数不是很敏感，省去了大量调参的时间。

两位本科生作为共同一作的这篇论文，也在Reddit上引发了热赞，作者本人也在这个论坛上展开了在线的答疑交流。

AdaBound已经开源，还放出了Demo。

AdaBound是什么

AdaBound结合了SGD和Adam两种算法，在训练开始阶段，它能像Adam一样快速，在后期又能像SGD一样有很好的收敛性。

SGD(随机梯度下降)算法历史悠久，它是让参数像小球滚下山坡一样

最低0.47元/天解锁文章

weixin_39747595

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。