深度学习中的优化器原理（SGD、RMSProp、Adam）

Bigwin01

已于 2024-04-15 12:28:55 修改

阅读量215

点赞数

文章标签：深度学习人工智能

于 2023-11-11 17:11:33 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44491551/article/details/134346962

版权

视频参考：

深度学习中的优化器原理(SGD,SGD+Momentum,Adagrad,RMSProp,Adam)_哔哩哔哩_bilibili

SGD：梯度下降

梯度是该位置上升最快的方向，负梯度是下降最快，所以更新参数是减去学习率✖️梯度

SGD + Momentum：

在上图这种情况，梯度幅度大的地方会主导梯度方向，如果用原始的SGD那么参数变化会在梯度幅度大的地方震荡（视频中10:00），所以考虑引入动量

v会累积之前的梯度，那在梯度变化大的地方会抵消（震荡过程中，梯度一正一负，累加就会抵消），梯度幅度小的地方会累加（梯度幅度小的地方，梯度方向一直保持不变，累加就会增大）

Adagrad：

参数的更新是由学习率和梯度共同决定，上面引入动量，其实是考虑改变梯度，其实也可以考虑自适应改变学习率。

刚才动量的累积让梯度变化大的地方梯度抵消，从而参数变化小，也可以让它在梯度变化大的地方更新步长（学习率）小。

引入累积平方梯度r，让梯度开平方，更新参数的时候作为学习率的分母，梯度越大，那学习率就会更小，梯度越小反而学习率（步长）更大。所以就可以在梯度变化大的地方步长小，在梯度变化缓慢的地方步长大。

r是累加过程，所以r是慢慢变大，慢慢的在梯度变化小的方向他的步长也会很小，从而无法继续更新，这时候RMSProp就解决这个问题

RMSProp：

引入衰减系数p，一般取0.999，范围（0，1）。

AdaGrad的累积平方梯度是累加之前所有的梯度平方，乘上衰减系数后，多次更新之后，之前的梯度的影响就会变小，（比如取p = 0.99，100次更新之后 p**100 = 0.36...），从而又可以根据当前的梯度来调节梯度。

Adam：

Adam则结合了SGD+Momentum和RMSProp的优点

另外也加入了一个修正，（视频中说是避免冷启动的问题）

假设衰减系数p = 0.999，动量参数a = 0.9，累积梯度v0 = 0，累积平方梯度r0 = 0，那么v1 = 0.1*g，r1 = 0.001*g*g，这两个值都很小，与实际的v1 = g，r1 = g*g相差很大，所以引入修正。

指数加权平均的修正参考：移动平均(Moving Average) - 知乎

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
深度学习中的优化器原理（SGD、RMSProp、Adam）

AdaGrad的累积平方梯度是累加之前所有的梯度平方，乘上衰减系数后，多次更新之后，之前的梯度的影响就会变小，（比如取p = 0.99，100次更新之后 p**100 = 0.36...），从而又可以根据当前的梯度来调节梯度。v会累积之前的梯度，那在梯度变化大的地方会抵消（震荡过程中，梯度一正一负，累加就会抵消），梯度幅度小的地方会累加（梯度幅度小的地方，梯度方向一直保持不变，累加就会增大）刚才动量的累积让梯度变化大的地方梯度抵消，从而参数变化小，也可以让它在梯度变化大的地方更新步长（学习率）小。
复制链接

扫一扫

Bigwin01 CSDN认证博客专家 CSDN认证企业博客

码龄6年

29: 原创

54万+: 周排名

26万+: 总排名

4万+: 访问

: 等级

341: 积分

12: 粉丝

33: 获赞

7: 评论

220: 收藏

私信

关注

热门文章

分类专栏

DL 1篇
算法 5篇
图像处理 11篇
论文 2篇

最新评论

阈值法进行边缘检测matlab
Jewson、: function I=percentile2i(h,P) %PERCENTILE2I Computes an intensity value given a percentile. %I=PERCENTILE2I(H,P) Given a percentile,P,and a histogram, %H,this function computes an intensity,I,representing the %Pth percentile and returns the value in I.P must be in the %range [0, 1] and I is returned as a value in the range [0, 1] %also. %Check value of P. if P<0||P>1 erro('The percentile must be in the range [0, 1]'); end %Normalized the histogram to unit area.If it is already normalized %the following computation has no effect. h=h/sum(h); %Cummulative distribution. C=cumsum(h); %Calculations. idx=find(C>=P,1,'first'); %Subtract 1 from idx because indexing starts at 1,but intensities %start at 0.Also,normalize to the range [0, 1]. I=(idx-1)/(numel(h)-1);
阈值法进行边缘检测matlab
weixin_57622668: 现在是 percentile2i 无法识别
阈值法进行边缘检测matlab
Bigwin01: tofloat 应该不是内置函数，我看我这是[code=plain] function [out, revertclass]=tofloat(in) %tofloat convert image to floating point identity=@(x) x; tosingle=@im2single; table={'uint8', tosingle, @im2uint8 'uint16', tosingle, @im2uint16 'int16', tosingle, @im2int16 'logical', tosingle, @logical 'double', identity, identity 'single', identity, identity}; classIndex=find(strcmp(class(in),table(:,1))); if isempty(classIndex) error('Unsupported inut image class.') end out=table{classIndex,2}(in); revertclass=table{classIndex,3}; [/code]
阈值法进行边缘检测matlab
weixin_57622668: 你好博主，请问在4中无法识别 tofloat 要怎么解决？
基于区域的图像分割matlab
Octopus.YU: f=padarray(f,[Q-M,Q-N],'post');怎么老是提示要非负呀

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。