PyTorch笔记18--优化器Optimizer（二）

最新推荐文章于 2024-08-03 21:20:29 发布

三天没吃小孩了

最新推荐文章于 2024-08-03 21:20:29 发布

阅读量358

点赞数 9

分类专栏： PyTorch学习文章标签： pytorch 笔记人工智能

本文链接：https://blog.csdn.net/zjhzxsljl/article/details/136213575

版权

PyTorch学习专栏收录该内容

32 篇文章 0 订阅

订阅专栏

learning rate 学习率

学习率：控制更新的步伐

梯度下降：

momentum 动量

Momentum（动量，冲量）：结合当前梯度与上一次更新信息，用于当前更新

torch.optim.SGD

optim.SGD(
    params, #管理的参数组
    lr=<object object>, #初始学习率
    momentum=0, #动量系数，贝塔
    dampening=0, 
    weight_decay=0, #L2正则化系数
    nesterov=False#是否采用NAG
)

NAG参考文献：《On the importance of initialization and momentum in deep learning》

Pytorch的十种优化器

1. optim.SGD：

随机梯度下降法《On the importance of initialization and momentum in deep learning 》

2. optim.Adagrad：

自适应学习率梯度下降法《Adaptive Subgradient Methods for Online Learning and Stochastic Optimization》

3. optim.RMSprop：

Adagrad的改进 http://www.cs.toronto.edu/~tijmen/csc321/slides/lecture_slides_lec6.pdf

4. optim.Adadelta：

Adagrad的改进《 AN ADAPTIVE LEARNING RATE METHOD》

5. optim.Adam：

RMSprop结合Momentum 《Adam: A Method for Stochastic Optimization》

6. optim.Adamax：

Adam增加学习率上限《Adam: A Method for Stochastic Optimization》

7. optim.SparseAdam

8. optim.ASGD：

随机平均梯度下降《Accelerating Stochastic Gradient Descent using Predictive Variancer Reduction》

9. optim.Rprop：

弹性反向传播《Martin Riedmiller und Heinrich Braun》

10. optim.LBFGS：

BFGS的改进

三天没吃小孩了

关注

9
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
PyTorch笔记18--优化器Optimizer（二）

自适应学习率梯度下降法《Adaptive Subgradient Methods for Online Learning and Stochastic Optimization》RMSprop结合Momentum 《Adam: A Method for Stochastic Optimization》Adam增加学习率上限《Adam: A Method for Stochastic Optimization》Adagrad的改进《 AN ADAPTIVE LEARNING RATE METHOD》
复制链接

扫一扫

专栏目录