小批量随机梯度下降

最新推荐文章于 2024-03-11 23:15:42 发布

weixin_44894740

最新推荐文章于 2024-03-11 23:15:42 发布

阅读量209

点赞数

分类专栏：深度学习

原文链接：http://zh.d2l.ai/chapter_deep-learning-basics/linear-regression.html

版权

小批量随机梯度下降梯度学习率超参数模型优化

关键词由CSDN通过智能技术生成

深度学习专栏收录该内容

19 篇文章 1 订阅

订阅专栏

小批量随机梯度下降——mini-batch stochastic gradient descent

算法：
先选取一组模型参数的初始值，如随机选取；接下来对参数进行多次迭代，使每次迭代都可能降低损失函数的值。在每次迭代中，先随机均匀采样一个由固定数目训练数据样本所组成的小批量（mini-batch） B ，然后求小批量中数据样本的平均损失有关模型参数的导数（梯度），最后用此结果与预先设定的一个正数的乘积作为模型参数在本次迭代的减小量。

以线性回归为例，模型的参数将做如下迭代：
在这里插入图片描述
在上式中， |B| 代表每个小批量中的样本个数（批量大小，batch size）， η 称作学习率（learning rate）并取正数。

需要强调的是，这里的批量大小和学习率的值是人为设定的，并不是通过模型训练学出的，因此叫作超参数（hyperparameter）。我们通常所说的“调参”指的正是调节超参数，例如通过反复试错来找到超参数合适的值。在少数情况下，超参数也可以通过模型训练学出。

参考：http://zh.d2l.ai/chapter_deep-learning-basics/linear-regression.html

weixin_44894740

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。