吴恩达深度学习笔记(44)-RMSprop

最新推荐文章于 2024-06-03 13:00:36 发布

极客Array

最新推荐文章于 2024-06-03 13:00:36 发布

阅读量1.2k

点赞数

分类专栏：深度学习吴恩达深度学习笔记文章标签： RMS 深度学习

本文链接：https://blog.csdn.net/Harpoon_fly/article/details/85345578

版权

RMSprop是一种优化算法，旨在加速梯度下降过程。它通过计算梯度的平方的指数加权平均数（S_dW和S_db），在参数更新时除以这些值的平方根，从而调整不同方向的学习速率。这使得在参数空间中摆动较大的方向（如b方向）学习速率减小，而推进方向（如W方向）的学习速率增大。RMSprop有助于提高学习效率，允许使用更大学习率而不失稳定性，并首次在Jeff Hinton的Coursera课程中被提出。

摘要由CSDN通过智能技术生成

RMSprop
你们知道了动量（Momentum）可以加快梯度下降，还有一个叫做RMSprop的算法，全称是root mean square prop算法，它也可以加速梯度下降，我们来看看它是如何运作的。

吴恩达深度学习笔记(44)-RMSprop
回忆一下我们之前的例子，如果你执行梯度下降，虽然横轴方向正在推进，但纵轴方向会有大幅度摆动，为了分析这个例子，假设纵轴代表参数b，横轴代表参数W，可能有W_1，W_2或者其它重要的参数，为了便于理解，被称为b和W。

所以，你想减缓b方向的学习，即纵轴方向，同时加快，至少不是减缓横轴方向的学习，RMSprop算法可以实现这一点。

吴恩达深度学习笔记(44)-RMSprop
在第t次迭代中，该算法会照常计算当下mini-batch的微分dW，db，所以我会保留这个指数加权平均数，我们用到新符号S_dW，而不是v_dW，因此S_dW=βS_dW+(1-β)dW^{2，澄清一下，这个平方的操作是针对这一整个符号的，这样做能够保留微分平方的加权平均数，同样S_db=βS_db+(1-β)db}2，再说一次，平方是针对整个符号的操作。

最低0.47元/天解锁文章

极客Array

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
吴恩达深度学习笔记(44)-RMSprop

RMSprop你们知道了动量（Momentum）可以加快梯度下降，还有一个叫做RMSprop的算法，全称是root mean square prop算法，它也可以加速梯度下降，我们来看看它是如何运作的。回忆一下我们之前的例子，如果你执行梯度下降，虽然横轴方向正在推进，但纵轴方向会有大幅度摆动，为了分析这个例子，假设纵轴代表参数b，横轴代表参数W，可能有W_1，W_2或者其它重要的参数，为了便...
复制链接

扫一扫

专栏目录