Adam优化器算法

最新推荐文章于 2024-05-29 16:20:40 发布

生命的呼喊

最新推荐文章于 2024-05-29 16:20:40 发布

阅读量2.6k

点赞数

分类专栏：基础知识

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/itpfzl/article/details/103568327

版权

基础知识专栏收录该内容

3 篇文章 0 订阅

订阅专栏

上图就是Adam算法在深度学习中更新参数时应用的详细过程，下面对一些参数进行一下说明：

1、t：更新的步数（steps）

2、 $\epsilon$ ：学习率，用于控制参数更新的步幅（stepsize）

3、 $\Theta$ ：要求解更新的参数

4、 $y^{i}$ :带有参数 $\Theta$ 的目标函数，通常指损失函数

5、g：目标函数对 $\Theta$ 求导的梯度

6、 $\beta ^{_{1}}$ ：一阶矩衰减系数

7、 $\beta2$ ：二阶矩衰减系数

8、s：梯度g的一阶矩，即梯度g的期望

9、r：梯度g的二阶矩，即梯度 $g^{2}$ 的期望

10、s三角：s的偏置矫正，考虑到s在零初始值情况下向零偏置

11、r三角：r的偏置矫正，考虑到r在零初始值情况下向零偏置

上图中while循环实现了整个Adam算法在梯度下降中的优化过程

1、计算目标函数对 $\Theta$ 的梯度

2、更新steps

3、计算梯度的一阶矩s，即过往梯度与当前梯度的平均，如上图s即是steps=t时的梯度一阶矩

4、计算梯度的二阶矩r，即过往梯度与当前梯度平方的平均，如上图r即是steps=t时的梯度二阶矩

5、修正梯度的一阶矩s，因为s的初始值为零，它容易向零偏置，这样处理后会减少这种偏置的影响，其公式中的 $\beta \tfrac{t}{1}$ 是指beat1的t次方

6、修正梯度的二阶矩r，因为r的初始值为零，它容易向零偏置，这样处理后会减少这种偏置的影响。

7、更新参数 $\Theta$ ，可以将 $\frac{\epsilon }{\sqrt{r}+\delta }$ 看成更新参数 $\Theta$ 的学习率，s三角：看成更新 $\Theta$ 参数的梯度

生命的呼喊

关注

0
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

生命的呼喊 CSDN认证博客专家 CSDN认证企业博客

码龄6年

55: 原创

10万+: 周排名

196万+: 总排名

9万+: 访问

: 等级

1308: 积分

32: 粉丝

50: 获赞

47: 评论

226: 收藏

私信

关注

分类专栏

YOLO 3篇
基础知识 3篇
SSD算法 4篇

最新评论

Vmware虚拟机下为Ubuntu添加磁盘
m0_63981928: 博主你好，我根据你的方法增加了一个500G的磁盘分区，但是进入虚拟机后，创建一个200G的分区，显示value out of range，10G也不行，这个是怎么回事呢？
ubuntu18.04开机时无法进入系统问题的解决方法
GalaxyerKw: 先按ctrl+alt+F7,就不闪了
ubuntu18.04开机时无法进入系统问题的解决方法
qq_41972200: 进入tty2输入没反应
ubuntu18.04开机时无法进入系统问题的解决方法
Timhow.: ALT+F2就黑屏了
根据xml文件找到对应的图片文件
愿你酷得像风: 显示无匹配怎么回事

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。