动量梯度下降法 Momentum

最新推荐文章于 2024-08-01 19:32:58 发布

南淮北安

最新推荐文章于 2024-08-01 19:32:58 发布

阅读量2.1k

点赞数

分类专栏：深度学习知识点笔记文章标签：动量梯度下降法 Momentum

深度学习知识点笔记专栏收录该内容

84 篇文章 416 订阅 ¥39.90 ¥99.00

订阅专栏

动量梯度下降法是优化梯度下降算法的一种方法，允许使用更大的学习率并减少迭代次数。它利用指数加权平均数（即动量）来平滑梯度，减少了在最小值附近震荡，加快了收敛速度。该方法结合了历史梯度信息，使得在相同方向的梯度更新中加速，而在反向梯度中逐渐减速，从而改善了下降路径的直线性。

摘要由CSDN通过智能技术生成

动量梯度下降法是对梯度下降法的一种优化算法，该方法学习率可以选择更大的值，函数的收敛速度也更快。
梯度下降法就像下面这张图，通过不断的更新 w与b，从而让函数移动到红点，但是要到达最优解，需要我们不断的迭代或者调整学习率来达到最后到达最优解的目的。
但是调大学习率会导致每一次迭代的步长过大，也就是摆动过大，误差较大。调小学利率会让迭代次数增加。而增加迭代次数则明显的增加了训练时间。
动量梯度下降法不但能使用较大的学习率，其迭代次数也较少
在这里插入图片描述

文章目录

- 一、指数加权和
- 二、动量梯度下降法

一、指数加权和

在理解动量梯度下降法之前，我们首先要了解指数加权平均数，这是动量梯度下降法的核心。

那么，什么是指数加权平均数呢，我们这里举例说明。

下面是一个同学的某一科的考试成绩：平时测验 80，期中 90，期末 95 学校规定的科目成绩的计算方式是：平时测验占 20%；期中成绩占 30%；期末成绩占 50%；这里，每个成绩所占的比重叫做权

了解本专栏

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。