深度学习-随机梯度下降

最新推荐文章于 2024-06-12 12:03:35 发布

白云如幻

最新推荐文章于 2024-06-12 12:03:35 发布

阅读量625

点赞数 9

分类专栏： PyTorch 深度学习文章标签：机器学习算法人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43227851/article/details/136027341

版权

深度学习同时被 2 个专栏收录

47 篇文章 0 订阅

订阅专栏

23 篇文章 0 订阅

订阅专栏

在训练过程中使用随机梯度下降，但没有解释它为什么起作用。为了澄清这一点，将继续更详细地说明随机梯度下降（stochastic gradient descent）。

%matplotlib inline
import math
from mxnet import np, npx
from d2l import mxnet as d2l

npx.set_np()

随机梯度更新

在深度学习中，目标函数通常是训练数据集中每个样本的损失函数的平均值。给定 $n$ 个样本的训练数据集，我们假设 $f_{i}(x)$ 是关于索引 $i$ 的训练样本的损失函数，其中 $x$ 是参数向量。然后我们得到目标函数

$x$ 的目标函数的梯度计算为

如果使用梯度下降法，则每个自变量迭代的计算代价为 $0(n)$ ，它随 $n$ 线性增长。因此，当训练数据集较大时，每次迭代的梯度下降计算代价将较高。

关注

9
点赞
踩
8

收藏

觉得还不错? 一键收藏
打赏
0
评论
深度学习-随机梯度下降

在训练过程中使用随机梯度下降，但没有解释它为什么起作用。为了澄清这一点，将继续更详细地说明。在深度学习中，目标函数通常是训练数据集中每个样本的损失函数的平均值。因此，当训练数据集较大时，每次迭代的梯度下降计算代价将较高。如果使用梯度下降法，则每个自变量迭代的计算代价为。然后我们得到目标函数。个样本的训练数据集，我们假设。的训练样本的损失函数，其中。的目标函数的梯度计算为。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

白云如幻 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。