Adam（Adaptive Moment Estimation）计算实例详解，帮助你理解Adam算法！

进击的水告

已于 2024-07-17 19:55:37 修改

阅读量755

点赞数 18

分类专栏：优化器文章标签：机器学习人工智能神经网络

于 2024-07-17 19:50:34 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_35382160/article/details/140503528

版权

优化器专栏收录该内容

2 篇文章 0 订阅

订阅专栏

Adam（Adaptive Moment Estimation）计算实例详解，帮助你理解Adam算法！

一、Adam算法原理

Adam（Adaptive Moment Estimation）是一种结合了动量（momentum）和自适应学习率调整的优化算法，它能够在深度学习模型的训练中更快地收敛并且对超参数的选择相对不那么敏感。

Adam算法原理概述
Adam算法结合了RMSProp和动量优化的优点，具体来说，它维护了两个动态调整的学习率：一个是基于梯度一阶矩估计的动量项，另一个是基于梯度二阶矩估计（类似于RMSProp）的自适应学习率。

二、Adam具体步骤和计算示例

2.1构建损失函数

假设我们要最小化一个简单的损失函数：

$J(\theta) = \frac{1}{2} (\theta^2 - 2\theta + 1)$

我们使用Adam算法来优化参数 $\theta$ 。

2.2初始化Adam算法的参数和变量：

初始化：
参数 $\theta = 0$ ，一阶矩估计 $m = 0$ （动量项）和二阶矩估计 $v = 0$ 。
设定超参数：
设定学习率 $\eta = 0.1$ 。
设定动量项的衰减率 $\beta_1 = 0.9$ 。
设定二阶矩估计（RMSProp）的衰减率 $\beta_2 = 0.999$ 。
设定一个很小的数值 $\epsilon = 10^{-8}$ （避免除以零）。

2.3迭代更新参数：

2.3.1计算梯度

对每个时间步 $t$ ，计算损失函数关于参数 $\theta$ 的梯度:

$\frac{\partial J(\theta)}{\partial \theta}= \theta - 1$

2.3.2更新一阶矩估计 $m$ （动量项）和二阶矩估计 $v$ （类似于RMSProp的更新）：

$m_t = \beta_1 m_{t-1} + (1 - \beta_1) \frac{\partial J(\theta)}{\partial \theta}$

$v_t = \beta_2 v_{t-1} + (1 - \beta_2) \frac{\partial J(\theta)}{\partial \theta}^2$

2.3.3校正偏差

由于一阶和二阶矩估计在初始时会偏向于零，需要进行校正：

$\hat{m}_t = \frac{m_t}{1 - \beta_1^t}$

$\hat{v}_t = \frac{v_t}{1 - \beta_2^t}$

2.3.4更新参数 $\theta$

根据校正后的一阶矩估计 $\hat{m}_t$ 和二阶矩估计 $\hat{v}t$ ，
更新参数 $\theta$ ： $\theta_{t+1} = \theta_t - \frac{\eta}{\sqrt{\hat{v}_t} + \epsilon} \hat{m}_t$

2.4实际计算过程

假设开始时 $\theta = 0$ ，进行第一个时间步的更新：

计算损失函数 $J(\theta)$ 的梯度 $\frac{\partial J(\theta)}{\partial \theta} = \theta - 1 = 0 - 1 = -1$ 。

更新一阶矩估计 $m_1 = 0.9 \cdot 0 + 0.1 \cdot (-1) = -0.1$

更新二阶矩估计 $v_1 = 0.999 \cdot 0 + 0.001 \cdot (-1)^2 = 0.001$

校正偏差： $\hat{m}_1 = \frac{-0.1}{1 - 0.9^1} = -1$

$\hat{v}_1 = \frac{0.001}{1 - 0.999^1} = 1$

更新参数： $\theta_1 = 0 - \frac{0.1}{\sqrt{1} + 10^{-8}} \cdot (-1) = 0.1$

然后，重复这些步骤直到收敛或达到预定的迭代次数。

这个例子展示了Adam算法如何利用动量和自适应学习率来优化参数，并且在不同的学习率和梯度条件下，自动调整步长以加快收敛速度。

进击的水告

关注

18
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。