优化算法--SGD，batch SGD

最新推荐文章于 2023-10-01 22:34:39 发布

NYAIoT

最新推荐文章于 2023-10-01 22:34:39 发布

阅读量1.2k

点赞数

分类专栏： # 优化算法文章标签： SGD Batch SGD 梯度下降随机梯度下降

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zenglaoshi/article/details/103230602

版权

本文介绍了优化算法中的两种重要方法——梯度下降和随机梯度下降（SGD）。SGD通过每次迭代计算一个样本的梯度来减少计算开销，而小批量随机梯度下降（batch SGD）在SGD的基础上引入了批量处理，以平衡计算效率和准确性。批量大小的选择影响着算法的收敛速度和资源消耗，学习率的调整是优化过程中的关键因素。

摘要由CSDN通过智能技术生成

优化算法–SGD，batch SGD

优化算法的目标函数是一个基于训练数据集的损失函数，优化的目标在于降低训练误差。在深度学习中主要面临两个挑战：局部最小值和鞍点。

梯度下降和SGD

多维梯度下降：目标函数的输入为向量，输出为标量。假设目标函数 $\mathbb{R}^d \rightarrow \mathbb{R}$ 的输入是一个 $d$ 维向量 $\boldsymbol{x} = [x_1, x_2, \ldots, x_d]^\top$ 。目标函数 $f(\boldsymbol{x})$ 有关 $\boldsymbol{x}$ 的梯度是一个由 $d$ 个偏导数组成的向量：

$\nabla_{\boldsymbol{x}} f(\boldsymbol{x}) = \bigg[\frac{\partial f(\boldsymbol{x})}{\partial x_1}, \frac{\partial f(\boldsymbol{x})}{\partial x_2}, \ldots, \frac{\partial f(\boldsymbol{x})}{\partial x_d}\bigg]^\top.$

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
优化算法--SGD，batch SGD

优化算法–SGD，batch SGD 优化算法的目标函数是一个基于训练数据集的损失函数，优化的目标在于降低训练误差。在深度学习中主要面临两个挑战：局部最小值和鞍点。梯度下降和SGD 多维梯度下降：目标函数的输入为向量，输出为标量。假设目标函数f:Rd→Rf: \mathbb{R}^d \rightarrow \mathbb{R}f:Rd→R的输入是一个ddd维向量x=[x1,x2,…...
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。