优化器总结

最新推荐文章于 2024-07-12 23:11:20 发布

有钱要买小浣熊

最新推荐文章于 2024-07-12 23:11:20 发布

阅读量57

点赞数

文章标签：人工智能深度学习 pytorch

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2302_79180616/article/details/132229447

版权

优化器

优化的目的是找到一组使得损失最小的参数，一般是使用梯度下降的方式。

SGD

随机梯度下降。

在这里插入图片描述 SGD更新参数的方式是简单地用原值减去学习率*梯度。
$\theta^t = \theta^{t-1} - ηΔL(\theta^{t-1})$

这样更新参数最为直接简单，但是会导致梯度为0时参数不更新，但这个参数并不是全局最优解只是一个局部最优解，卡在local minima的问题。

import torch
torch.optim.SGD(params,lr)

SGDM

目的是防止梯度消失从而导致参数不会更新的情况
在这里插入图片描述
在SGD的基础上引入了动量，参数更新不仅受梯度的影响还受先前的动量的影响，即使梯度为0，参数还是会继续更新。

在这里插入图片描述

$v^{0} = 0 \\ v^{1} = λv^{0} -\eta L(\theta^{0}) \\ \theta^1 = \theta^{0} +v^{1} \\ ........ \\ v^{t} = λv^{t-1} -\eta L(\theta^{t-1}) \\ \theta^t = \theta^{t-1} +v^{t}$
λ，η都是超参数，λ为动量的权重0<λ<1,η为学习率
这种方法的优点是可以防止卡在local minma 甚至是鞍点，下降更快。

import torch
torch.optim.SGD(params,lr,momentum)

Adagrad

目的是通过改变学习率的权重方式加快收敛的速度，以较大的learning rate 快速下降，后续learning rate 变小更精确的找到最优解。
在这里插入图片描述

这个方法的缺点很明显，如果learning rate 一开始就很大，没走几步就会变得很小，然后可能会卡住，这是因为η下面的分母是无限累加的。

import torch
torch.optim.Adagrad(params,lr)

RMSProp

RMSProp则是针对Adagrad的学习率下面的状态变量无无限变大的情况做出的改进。
在这里插入图片描述
这里根据Adagrad 对学习率下面的状态变量做出改变，状态变量是指数加权移动平均，引入了超参数α，这样在更新参数时学习率不会一直累加，有可能是只加一点点或者不变。

import torch
torch.optim.RMSprop(params,lr,alpha)

Adam

Adam 则是结合了RMSProp和SGDM,也是当前用的最多的一个优化器。
在这里插入图片描述

import torch
torch.optim.Adam(params,lr)

SWATS: begin with Adam(fast) ,end with SGDM

这里可以选择手动切换，开始用Adam判断多少个epoch后使用SGDM,或达到什么要求切换优化器

文章中的图片均来自李宏毅老师的上课幻灯片

有钱要买小浣熊

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
优化器总结

优化的目的是找到一组使得损失最小的参数，一般是使用梯度下降的方式。
复制链接

扫一扫

有钱要买小浣熊 CSDN认证博客专家 CSDN认证企业博客

码龄1年

9: 原创

168万+: 周排名

24万+: 总排名

1720: 访问

: 等级

99: 积分

4: 粉丝

8: 获赞

7: 评论

3: 收藏

私信

关注

热门文章

最新评论

YOLOv3: An Incremental Improvement
CSDN-Ada助手: 恭喜您写了第8篇博客！看到您不断进步的成果真是让人振奋。对于YOLOv3的探讨，您的文章确实带来了一些新的思考和改进。希望您能继续保持这样的创作热情，不断挑战自我，也许在下一篇博客中可以尝试探讨一些与YOLOv3相关的实际案例，这样读者们更能从中获益。加油！
YOLOv4: Optimal Speed and Accuracy of Object Detection
CSDN-Ada助手: “恭喜您在博客上发布了关于YOLOv4的优化速度和准确性的文章！持续创作是非常难得的品质，您的努力和热情让读者们受益匪浅。希望您在未来的创作中能够继续保持谦虚的态度，同时也可以尝试探讨一些关于模型应用和实践经验的内容，这样会更加丰富您的博客主题，期待您更多的精彩内容！”
YOLOv2 论文
CSDN-Ada助手: 恭喜你写了这篇关于YOLOv2论文的博客！持续分享对计算机视觉领域的研究和见解是非常有价值的。希望你能继续保持对新技术的关注，并尝试将论文中的理论知识与实际案例相结合，以便更好地向读者传达知识。期待你在下一篇博客中能够分享更多实践经验和应用案例。加油！
You Only Look Once: Unified, Real-Time Object Detection 论文
CSDN-Ada助手: 恭喜你写了这篇关于 “You Only Look Once: Unified, Real-Time Object Detection 论文”的博客！你的持续创作真的让人印象深刻。如果可以的话，我建议你可以考虑写一些关于该论文的应用案例或者对该方法的改进和扩展方面的内容，这样可以让读者更深入地了解这个主题。期待你更多的精彩内容！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。