RMSProp优化算法（理论、公式、代码）

最新推荐文章于 2025-03-08 13:26:55 发布

m0_48923489

最新推荐文章于 2025-03-08 13:26:55 发布

阅读量7.9k

点赞数 25

文章标签：算法人工智能

本文链接：https://blog.csdn.net/m0_48923489/article/details/136863547

版权

RMSProp是一种解决Adagrad学习率问题的优化算法，通过指数加权移动平均调整学习率。它自适应地调整参数，但在选择超参数时依赖性较强。适用于深度学习中的大规模问题，但并非所有场景都适用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

RMSProp

RMSProp（Root Mean Square Propagation）是一种自适应学习率的优化算法，主要用于深度学习中的参数更新。旨在解决 Adagrad 算法在深度学习训练过程中学习率逐渐减小直至无法进一步学习的问题。

提出的契机

Adagrad 算法通过累积历史梯度的平方来调整每个参数的学习率，从而实现对频繁更新参数的惩罚和对不频繁更新参数的鼓励。然而，Adagrad 也存在一个问题：随着参数更新的累积，学习率会越来越小，最终导致学习过程提前结束。RMSProp 通过引入一个衰减系数来解决这个问题，使得历史信息能够指数级衰减，从而避免了学习率持续下降的问题。

理论与公式

RMSProp 的核心思想是对每个参数使用不同的学习率，这些学习率是根据参数的最近梯度大小自适应调整的。具体来说，RMSProp 使用平方梯度的指数加权移动平均来调整学习率，从而使得学习率的调整更加平滑。

修改后的公式如下：

While 条件：
- $\nabla_{\theta_{k-1}} L(\theta)$
- $r_{k} = \beta r_{k-1} + (1 - \beta) g \odot g$
- $\eta = \frac{\eta}{\sqrt{r_{k} + \epsilon}}$
- $\theta_{k} = \theta_{k-1} - \eta g$

其中， $\odot$ 表示元素乘积， $\beta$ 是衰减系数（通常设置为 0.9），用于控制历史信息的衰减速度， $\epsilon$ 是为了避免除以 0 的小常数（通常设置为 $1 e - 8$ ）。

代码示例

下面是一个简单的 RMSProp 更新规则的 Python 代码示例：

def rmsprop_update(parameters, gradients, sq_grads, lr=0.01, beta=0.9, epsilon=1e-8):
    for param, grad in zip(parameters, gradients):
        sq_grads[param] = beta * sq_grads[param] + (1 - beta) * (grad ** 2)
        param_update = lr / (np.sqrt(sq_grads[param]) + epsilon) * grad
        param -= param_update

在这个函数中，parameters 是模型参数列表，gradients 是对应的梯度列表，sq_grads 是历史梯度平方的累积（需要初始化），lr 是学习率，beta 和 epsilon 是 RMSProp 算法的超参数。