随机梯度下降和小批量梯度下降详解

小夏refresh

已于 2024-06-17 10:41:55 修改

阅读量913

点赞数

分类专栏：机器学习文章标签：深度学习机器学习人工智能随机梯度下降

于 2020-09-02 15:36:53 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/c2861024198/article/details/108363057

版权

机器学习专栏收录该内容

14 篇文章 2 订阅

订阅专栏

文章目录

普通梯度下降
随机梯度下降(SGD, Stochastic Gradient Descent)
- 随机梯度下降的特点
小批量梯度下降(Mini_Batch Gradient Densent)
- 小批量梯度下降的特点

所谓随机梯度下降, 顾名思义, 就是随机选取数据来做随机梯度下降.

普通梯度下降

普通的梯度下降的计算公式为:
$\omega = \omega - \lambda\frac{\partial J}{\omega}$
其中, $J$ 为损失函数, 而 $\omega$ 就是我们需要求的参数, $\lambda$ 为步长, 也就是我们所说的学习率.

也就是说, 梯度下降法其实就是将相应的参数按照梯度下降的方向前进一点点, $l amb d a$ 限制了我们每次向梯度下降的方向所走的长度.

随机梯度下降(SGD, Stochastic Gradient Descent)

所谓梯度随机下降, 顾名思义, 就是随机选取数据来做梯度下降.

由于梯度下降法每次东欧需要计算所有的数据, 当数据的数量很大时, 那么计算一次梯度下降的时间就会很长, 因此随机梯度下降就产生了.

随机梯度下降每次使用一个数据进行梯度下降的训练, 其终止方法与普通的梯度下降法相同.

随机梯度下降的特点

优点

每一次的学习时间很快
如果目标函数有盆地区域, SGD会使优化的方向从当前局部极小值点跳到另一个更好的局部最小值点
最终收敛于一个较好的极值点甚至是全局极值点

缺点

每次更新可能并不会按照正确的方向进行, 参数具有高方差, 从而导致损害函数剧烈波动

小批量梯度下降(Mini_Batch Gradient Densent)

由于随机梯度下降算法每次使用一个训练数据, 因此随机梯度下降的方差会比较大, 因此, 小批量梯度下降就产生了. 小批量梯度下降与随机梯度下降不同的是: 小批量梯度下降每次使用一小部分数据进行梯度下降训练, 这样会使得其更具有代表性, 收敛速度比SGD更快, 也更加稳定.

小批量梯度下降的特点

收敛速度比SGD更快, 更稳定
在最优解附近跳动不会太大, 容易得到更好的解

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

小夏refresh CSDN认证博客专家 CSDN认证企业博客

码龄6年

38: 原创

2万+: 周排名

2万+: 总排名

11万+: 访问

: 等级

1149: 积分

163: 粉丝

246: 获赞

37: 评论

527: 收藏

私信

关注

热门文章

分类专栏

深度学习 11篇
论文 12篇
计算机视觉 9篇
语义分割 2篇
工具 2篇
wsl2 1篇
数据挖掘 4篇
机器学习 14篇
linux 1篇
推荐算法 1篇
数据分析 1篇
Python 3篇
最大似然估计 1篇
极大似然估计 1篇
编程语言 1篇
markdown 1篇
爬虫 1篇
C语言 5篇
数据结构 5篇

最新评论

论文阅读笔记: DINOv2: Learning Robust Visual Features without Supervision
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文阅读笔记: Segment Anything
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文笔记: Boosting Object Detection with Zero-Shot Day-Night Domain Adaptation
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文阅读笔记:RepViT: Revisiting Mobile CNN From Vit Perspective
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
DGMamba: Domain Generalization via Generalized State Space Model论文笔记
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

小夏refresh 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。