梯度下降概念图解——BGD批量梯度下降、SGD随机梯度下降、MBGD小批量梯度下降

小白顶呱呱

已于 2024-08-08 15:35:31 修改

阅读量208

点赞数 2

分类专栏：机器学习文章标签：机器学习 nlp 深度学习

于 2024-08-07 13:52:02 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Yaki_Duck/article/details/140987240

版权

机器学习专栏收录该内容

9 篇文章 0 订阅

订阅专栏

文章目录

一、梯度下降概念、算法流程
二、梯度下降

一、梯度下降概念、算法流程

梯度下降的完整过程：
1定义代价函数→2选择起始点→3计算梯度→4按学习率前进箭头→（3计算梯度 → 4按学习率前进箭头）重复直至找到最低点。
示例：pandas 是基于NumPy 的一种工具，该工具是为了解决数据分析任务而创建的。
什么是梯度下降？先补充一个概念

均方误差：误差平均和的平均值。

对于这个图来说：点p1的均方误差e1就为：e1=(y1-w*x1)^2。

范德萨
拓展到计算每一个点就可以算出无数的e1,e2,e2…,en。
在这里插入图片描述
求所有点误差的平均值：（其中x,y和样本数n都是已知数，用常量a,b.c分别代替）

loss function: 得出的误差函数e = a*w^2 + b*w + c表示了学习所需要付出的代价，该函数也是样本点拟合过程的映射（如下图）。
在这里插入图片描述

3 计算梯度

4 学习率

通过学习率调整权重：
在这里插入图片描述

5 循环迭代

二、梯度下降

1 BGD批量梯度下降——全部样本参与计算

左侧：样本点
右侧：代价函数表示的曲面

BGD批量梯度下降是梯度下降最原始的方式，可以保证算法精准度，找到全局最优点，but训练搜索过程慢，代价大。

在这里插入图片描述

2 SGD随机梯度下降

SGD随机梯度下降，每下降一步只需要用一个样本进行计算。
优：提升了计算速度
缺：牺牲了一定的精准度
在这里插入图片描述

3 MBGD小批量梯度下降

相对快、相对精准
在这里插入图片描述

4 可能存在的问题

陷入局部最优解
在这里插入图片描述

reference:【【梯度下降】3D可视化讲解通俗易懂】 https://www.bilibili.com/video/BV18P4y1j7uH/?share_source=copy_web&vd_source=334dbcc5ec1e90276a3fca594c89e11e

小白顶呱呱

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
梯度下降概念图解——BGD批量梯度下降、SGD随机梯度下降、MBGD小批量梯度下降

求所有点误差的平均值：（其中x,y和样本数n都是已知数，用常量a,b.c分别代替）对于这个图来说：点p1的均方误差e1就为：e1=(y1-w*x1)^2。表示了学习所需要付出的代价，该函数也是样本点拟合过程的映射（如下图）。拓展到计算每一个点就可以算出无数的e1,e2,e2…SGD随机梯度下降，每下降一步只需要用一个样本进行计算。loss function: 得出的误差函数。BGD批量梯度下降是梯度下降最原始的方式，）重复直至找到最低点。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。