优化算法总结

jerry_young14

已于 2022-07-03 12:37:38 修改

阅读量280

点赞数

文章标签：算法机器学习人工智能

于 2022-07-03 12:35:39 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jerry__young/article/details/125583286

版权

本文总结了优化算法，包括SGD、SAG、SVRG等降低方差类算法，以及Momentum、NAG、Adagrad和Adam等增加收敛速率类算法。这些算法在机器学习和人工智能中用于提升模型训练效率。

摘要由CSDN通过智能技术生成

SGD（Stochastic Gradient Descent）：随机梯度下降，每一次计算mini-batch的平均梯度，然后更新参数

降低方差类

SAG（Stochastic Average Gradient）：随机平均梯度，该算法的梯度更新公式为：
$w^{k+1}=w^{k}-\frac{\alpha_{k}}{k} \sum_{j=1}^{k} g_{i_{j}}(w^{j})$
不同于SGD，SAG额外记录了一张以往的梯度更新表，在迭代的过程中，不断地记录当前参数下的梯度，且在当前步进行参数更新时，选取的梯度是过去所记录的所有梯度的平均值。

SVRG（Stochastic Variance Reduction Gradient）：随机方差下降，该算法旨在减小梯度的方差，其梯度更新公式如下：
$w^{k}=w^{k-1}-\alpha (g_{i}(w^{k-1})-g_{i}(\tilde{w})+\tilde{\mu})$

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
优化算法总结

常见优化算法总结
复制链接

扫一扫

jerry_young14 CSDN认证博客专家 CSDN认证企业博客

码龄4年

5: 原创

123万+: 周排名

217万+: 总排名

7524: 访问

: 等级

63: 积分

1: 粉丝

4: 获赞

4: 评论

15: 收藏

私信

关注

热门文章

最新评论

Dynamic Scene Graph Generation via Anticipatory Pre-training论文阅读笔记
kbkl: 博主你好，请问能找到论文的源码吗，在文献中我没有发现
光流法简介
weixin_45451002: 请问深度学习部分的代码有嘛？
Video Visual Relation Detection 论文阅读笔记
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。