deep_learning_neural network梯度下降

最新推荐文章于 2023-05-20 15:41:32 发布

weixin_30772261

最新推荐文章于 2023-05-20 15:41:32 发布

阅读量117

点赞数

文章标签：人工智能

原文链接：http://www.cnblogs.com/0405mxh/p/11603427.html

版权

神经网络优化算法：梯度下降法、Momentum、RMSprop和Adam

最近回顾神经网络的知识，简单做一些整理，归档一下神经网络优化算法的知识。关于神经网络的优化，吴恩达的深度学习课程讲解得非常通俗易懂，有需要的可以去学习一下，本人只是对课程知识点做一个总结。吴恩达的深度学习课程放在了网易云课堂上，链接如下（免费）：
https://mooc.study.163.com/smartSpec/detail/1001319001.htm

神经网络最基本的优化算法是反向传播算法加上梯度下降法。通过梯度下降法，使得网络参数不断收敛到全局（或者局部）最小值，但是由于神经网络层数太多，需要通过反向传播算法，把误差一层一层地从输出传播到输入，逐层地更新网络参数。由于梯度方向是函数值变大的最快的方向，因此负梯度方向则是函数值变小的最快的方向。沿着负梯度方向一步一步迭代，便能快速地收敛到函数最小值。这就是梯度下降法的基本思想，从下图可以很直观地理解其含义。

梯度下降法的迭代公式如下：

w = w - α * d w

其中w是待训练的网络参数，

Momentum算法

Momentum算法又叫做冲量算法，其迭代更新公式如下：

{v = β v + (1 - β) d w w = w - α v

光看上面的公式有些抽象，我们先介绍一下指数加权平均，再回过头来看这个公式，会容易理解得多。

指数加权平均

假设我们有一年365天的气温数据

这些数据有些杂乱，我们想画一条曲线，用来表征这一年气温的变化趋势，那么我们需要把数据做一次平滑处理。最常见的方法是用一个华东窗口滑过各个数据点，计算窗口的平均值，从而得到数据的滑动平均值。但除此之外，我们还可以使用指数加权平均来对数据做平滑。其公式如下：

{v 0 = 0 v k = β v k - 1 + (1 - β) θ k,

v就是指数加权平均值，也就是平滑后的气温。

对于

v k = β v k - 1 + (1 - β) θ k = β k v 0 + β k

可见，平滑后的气温，是以往每一天原始气温的加权平均值，只是这个权值是随时间的远近而变化的，离今天越远，权值越小，且呈指数衰减。从今天往前数k天，它的权值为

v k = β v k - 1 + ( 1 - β ) θ k 1 - β k

回看Momentum算法

现在再回过头来看Momentum算法的迭代更新公式：

{v = β v + (1 - β) d w w = w - α v

RMSprop算法

对于上面的这个椭圆形的抛物面（图中的椭圆代表等高线），沿着横轴收敛速度是最快的，所以我们希望在横轴（假设记为w1）方向步长大一些，在纵轴（假设记为w2）方向步长小一些。这时候可以通过RMSprop实现，迭代更新公式如下：

{s 1 = β 1 s 1 + (1 - β 1) d w 2 1 s 2 = β 2 s 2 + (1 - β 2

⎧⎩⎨ w 1 = w 1 - α d w 1 s 1 + ϵ\sqrt w 2 = w 2 - α d w 2

观察上面的公式可以看到，s是对梯度的平方做了一次平滑。在更新w时，先用梯度除以

{s = β s + (1 - β) d w 2 w = w - α d w s + ϵ\sqrt

Adam算法

Adam算法则是以上二者的结合。先看迭代更新公式：

⎧⎩⎨⎪⎪ v = β 1 v + (1 - β 1) d w s = β 2 s + (1 - β 2) d w 2 w = w -

典型值：

转载于:https://www.cnblogs.com/0405mxh/p/11603427.html

weixin_30772261

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
deep_learning_neural network梯度下降

神经网络优化算法：梯度下降法、Momentum、RMSprop和Adam最近回顾神经网络的知识，简单做一些整理，归档一下神经网络优化算法的知识。关于神经网络的优化，吴恩达的深度学习课程讲解得非常通俗易懂，有需要的可以去学习一下，本人只是对课程知识点做一个总结。吴恩达的深度学习课程放在了网易云课堂上，链接如下（免费）：https://mooc.study.163.com/sma...
复制链接

扫一扫