每天3分钟，彻底弄懂神经网络的优化器（五）Rprop

真-忒修斯之船

已于 2024-10-06 01:42:27 修改

阅读量963

点赞数 13

分类专栏： LLMForEverybody 文章标签：神经网络人工智能深度学习 Optimizer 优化器

于 2024-10-05 22:34:20 首次发布

本文链接：https://blog.csdn.net/qq_25295605/article/details/142720074

版权

LLMForEverybody 专栏收录该内容

43 篇文章 0 订阅

订阅专栏

1. Rprop算法的提出

Rprop（Resilient 弹性 Backpropagation）算法是由Martin Riedmiller和Hermann Braun在1993年提出的。这一算法在论文《A Direct Adaptive Method for Faster Backpropagation Learning: The RPROP Algorithm》1 中被详细描述，该论文发表在1993年的IEEE国际会议上。Rprop算法通过仅使用梯度的符号来计算更新，而不是梯度的大小，从而动态地为每个权重独立地调整步长。这种方法克服了传统梯度下降算法的一些固有缺点，并且由于其对误差函数行为的局部适应性，使得学习过程更加高效和透明。

2. Rprop算法的原理

初始化：为每个权重 $w_i$ 初始化学习率 $\eta_i$ 和变化量 $\Delta_i$ ，通常 $\Delta_i$ 的初始值设为一个小的正数。
更新规则：
- 如果 $g_t$ （当前梯度）和 $ g_{t-1} $（上一时刻的梯度）同号，则增加学习率：
  $\Delta_i = \min(\Delta_{\text{max}}, \eta_i + \Delta_i)$
- 如果 $ g_t $ 和 $ g_{t-1} $ 异号或 $ g_t $ 为零，则减少学习率：
  $\Delta_i = \max(\Delta_{\text{min}}, \eta_i - \Delta_i)$
- 如果 $ g_t $ 和 $ g_{t-1} $ 都为零，则重置学习率：
  $\Delta_i = \Delta_{\text{init}}$
权重更新：
$w_i = w_i - \Delta_i \cdot \text{sign}(g_t)$
其中 $g_t$ 是当前梯度， $\text{sign}(g_t)$ 是梯度的符号函数。