Adam和AdamW

最新推荐文章于 2023-09-21 19:00:00 发布

Xafter0

最新推荐文章于 2023-09-21 19:00:00 发布

阅读量5.5k

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Xafter0/article/details/82251410

版权

机器学习专栏收录该内容

14 篇文章 0 订阅

订阅专栏

Adam可以看作是RMSprob和动量SGD的结合

目的在于抑制震荡加速收敛

Adam

\(while \theta_t 不收敛\)

计算损失函数关于\(\theta\)的梯度\(g_{\theta}\)

\(t = t + 1\)

计算一阶动量项

\(s_t=\alpha_1s_{t-1} + (1 - \alpha_1)g_{\theta}\)

计算二阶动量项

\(v_t=\alpha_2v_{t-1} + (1-\alpha_2)g_{\theta}^2\)

动量项修正

\(\hat s_t = \frac{s_t}{1 - \alpha_1^t}\)

\(\hat v_t = \frac{v_t}{1 - \alpha_2^t}\)

更新

\(\theta_t = \theta_{t-1}-\alpha \frac{\hat s_t}{\sqrt{\hat v_t}+\epsilon}\)

Adamw

带正则项的损失函数为

$$L=loss + \frac{1}{2}||\theta||^2$$

在实际更新参数时是按照权重衰减的方式进行更新的具体如下式

$$\theta_t = \theta_{t-1} - \alpha \frac{\partial loss}{\partial \theta}|_{\theta=\theta_{t-1}} - \alpha \theta_{t-1}$$

其中后面一项对应L2正则项的导数。

在实际计算时往往是直接更新未加正则项的损失函数的梯度然后减去一个权重衰减项，这只在SGD中与直接计算整体损失函数的梯度等价，而在带动量的SGD或者Adam中均不等价，比如计算带动量的SGD更新时，采用两种方式更新的方式分别为

\(v_t = \alpha v_{t-1} + (1 - \alpha)\frac{\partial loss}{\partial \theta}\)

1.\(\theta_t = \theta_{t-1} - \epsilon v_t - \epsilon \theta_{t-1}\)

2.\(\theta_t = \theta_{t-1} - \epsilon v_t - \epsilon (1 - \alpha) \theta_{t-1}\)

在Adam中的差别将会更大，Adamw则是在Adam的更新策略中采用了计算整体损失函数的梯度来进行更新而不是只计算不带正则项部分的梯度进行更新之后再进行权重衰减。

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
1
评论
Adam和AdamW

Adam可以看作是RMSprob和动量SGD的结合目的在于抑制震荡加速收敛Adam\(while \theta_t 不收敛\)计算损失函数关于\(\theta\)的梯度\(g_{\theta}\)\(t = t + 1\)计算一阶动量项\(s_t=\alpha_1s_{t-1} + (1 - \alpha_1)g_{\theta}\)计算二阶动量项\(v_t=\...
复制链接

扫一扫

专栏目录

Xafter0 CSDN认证博客专家 CSDN认证企业博客

码龄8年

30: 原创

19万+: 周排名

62万+: 总排名

3万+: 访问

: 等级

728: 积分

10: 粉丝

11: 获赞

5: 评论

39: 收藏

私信

关注

热门文章

分类专栏

最新评论

推荐算法冷启动
虚坏叔叔: 学到了，学到了,给大佬点赞！
Adam和AdamW
可乐cole: 最后一句好像错了
泛化误差，偏差方差分解
计算机小白_: 周老师好
推荐算法随机游走
Xafter0 回复 little_dimple007: 这可以看作是一个递推公式，应该写成这样Pt = (1-alpha)P0 + alpha M'Pt-1,即后一个时刻的P由前一个时刻的P得到
推荐算法随机游走
little_dimple007: P=(1−α)P0+αMTP,这个公式前后两个P应该不一样吧，是指两个状态？

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。