基础优化算法之梯度下降法

最新推荐文章于 2022-04-06 11:45:05 发布

tinason杨

最新推荐文章于 2022-04-06 11:45:05 发布

阅读量624

点赞数

文章标签：算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_58462637/article/details/123450647

版权

本文介绍了梯度下降法在无显示解的模型中的应用，通过不断迭代更新权重以逼近最优解。学习率是关键参数，控制着参数更新的步长。小批量随机梯度下降结合了批量处理和随机性，平衡计算效率与模型收敛。适合大规模数据集的训练，并讨论了批量大小的选择原则。

摘要由CSDN通过智能技术生成

一：直接梯度下降法

当一个模型不能像线性回归那样，得出一个确定的显示解时，即无显示解时，则可用梯度下降法，得出模型的较优权重

1.挑选一个随机初始值w0

2.在接下来的时刻里面，不断去更新w0的值，使得它接近我们的最优解，

对上图的说明：

η是学习率，∂wt−1是在wt-1处的梯度，∂ℓ为损失函数

梯度的含义：使得函数的值增加最快的方向

负梯度的含义：使得函数的值减少最快的方向（此公式中有个负号，所以是负梯度）

学习率：沿着这个方向每次走多远（即步长）

超参数：即需要人为来指定的值

1.问：为什么通过上述公式能得到最优解？

因为每次迭代都沿着损失函数的方向下降的方向改变参数（导数项），所以会找到最优解

2.选择学习率：

后面会有教程教大家如何选取合适的学习率

二：小批量随机梯度下降

ps：如果是在整个模型上进行梯度下降的话，一般要走几百到几千步

对于选择批量的大小：

不能太小：每次计算量太小，不适合并行运算来最大利用计算资源

不能太大：内存消耗增加，浪费计算，例如<如果所有样本都是相同的>

总结：

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
基础优化算法之梯度下降法

当无法得出显示解时，可采用梯度下降的方法，来得出较优权重值
复制链接

扫一扫

tinason杨 CSDN认证博客专家 CSDN认证企业博客

码龄3年

15: 原创

73万+: 周排名

61万+: 总排名

2万+: 访问

: 等级

181: 积分

21: 粉丝

24: 获赞

5: 评论

73: 收藏

私信

关注

热门文章

最新评论

线性回归的简洁实现（调库）
安桓: 因为是搬运李沐的内容，你可以自己去搜书中其余的，都是dive into deep learning的pytorch版本
线性回归的简洁实现（调库）
oyufei996: 写的真好，博主为啥不继续更新了
线性回归的简洁实现（调库）
tinason杨: 第一个f'是print的一类语法，使用f'的话，则输出变量写在{}中，第二个:f是控制字符，表示使用浮点型输出变量
线性回归的简洁实现（调库）
草莓樱桃味的尔尔尔尔尔: 想问一下 print(f'epoch {epoch + 1}, loss {l:f}')中的f是什么意思呀

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

tinason杨 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。