优化器：SGD with Momentum

wekings

已于 2022-03-25 17:21:02 修改

阅读量1.3k

点赞数 2

文章标签：算法深度学习 python

于 2022-03-25 17:18:38 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wekings/article/details/123737469

版权

（1）指数加权平均：一种近似求平均的方法，公式如下：

$v_{t}=\beta \ast v_{t-1}+(1-\beta )\theta _{t}$

$v_{t}$ 代表局部的平均值。 $\theta _{t}$ 代表第t个数据的值。 $\beta$ 是可调节超参。可近似为前 $\frac{1}{1-\beta }$ 个数据的的平均值。

举例说明，设 $\beta=0.9$ ，则近似代表近10个数据的平均值：

$v_{4}=0.9v_{3}+0.1\theta _{4}=0.9(0.9v_{2}+0.1\theta _{3})+0.1\theta _{4}=0.81v_{2}+0.09\theta _{3}+0.1\theta _{4}=0.81(0.9v_{1}+0.1\theta _{2})+0.09\theta _{3}+0.1\theta _{4}=0.729v_{1}+0.081\theta _{1}+0.09\theta _{3}+0.1\theta _{4}=0.1\times 0.9^{3}\times \theta _{1}+0.1\times 0.9^{2}\times \theta _{2}+0.1\times 0.9^{1}\times \theta _{3}+0.1\theta _{4}$

指数递减的加权的移动平均，越近期的数据加权越大。 $v_{t}$ 对原始数据做了平滑，降低了原始数据的震荡程度，怎么看是前多少个数据的平均值呢，n通过 $\beta ^{n}\approx \frac{1}{e}$ 得到。

（2）SGD with Momentum

采用上述指数加权平均的思路，在SGD中增加动量的概念，使得前几轮的梯度也会加入到当前的计算中（会有一定衰减），通过对前面一部分梯度的指数加权平均使得梯度下降过程更加平滑，减少动荡，收敛也比普通的SGD快。当前梯度方向与累计梯度方向一致时，梯度会被加强，从而这一步下降幅度增大，若方向不一致，则会减弱当前下降的梯度幅度。

$v_{t}=\beta \ast v_{t-1}+(1-\beta )\Delta J(\theta )$

$\Delta J(\theta )$ 是当前梯度值， $\beta$ 常设为0.9，也就是前10个梯度的平均值。参数 $\theta$ 的更新公式如下：

$\theta =\theta -\alpha v_{t}$

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

wekings CSDN认证博客专家 CSDN认证企业博客

码龄15年

9: 原创

27万+: 周排名

174万+: 总排名

1万+: 访问

: 等级

128: 积分

6: 粉丝

17: 获赞

9: 评论

49: 收藏

私信

关注

热门文章

最新评论

win10部署milvus以图搜图2.0
moonquakes279: 我在模型下载的地方总出错2023-10-19 08:59:33,973 ｜ INFO ｜ _builder.py ｜ load_pretrained ｜ 182 ｜ Loading pretrained weights from Hugging Face hub (timm/resnet50.a1_in1k) 2023-10-19 08:59:33,986 ｜ DEBUG ｜ connectionpool.py ｜ _new_conn ｜ 1048 ｜ Starting new HTTPS connection (1): huggingface.co:443 2023-10-19 08:59:54,174 ｜ WARNING ｜ _http.py ｜ http_backoff ｜ 271 ｜ '(MaxRetryError("HTTPSConnectionPool(host='huggingface.co', port=443): Max retries exceeded with url: /timm/resnet50.a1_in1k/resolve/main/model.safetensors (Caused by ConnectTimeoutError(<urllib3.connection.HTTPSConnection object at 0x0000017EAF778B50>, 'Connection to huggingface.co timed out. (connect timeout=10)'))"), '(Request ID: 0ac39ab9-0169-47eb-9240-34cf2b14c8e4)')' thrown while requesting HEAD https://huggingface.co/timm/resnet50.a1_in1k/resolve/main/model.safetensors 2023-10-19 08:59:54,177 ｜ INFO ｜ _hub.py ｜ load_state_dict_from_hf ｜ 180 ｜ [timm/resnet50.a1_in1k] Safe alternative available for 'pytorch_model.bin' (as 'model.safete
win10部署milvus以图搜图2.0
weixin_41477294: mysql在这里是干嘛用的？
kaggle下载数据集，解决无法人机校验问题
m0_56356630: 有用，赞！
win10部署milvus以图搜图2.0
wekings: 那是映射docker路径的意思
nltk下载失败的解决办法
碳酸氢钠868: 点击下载之后打不开网页

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。