动手学深度学习PyTorch版---lastDay_1

最新推荐文章于 2021-07-12 15:00:50 发布

Courageux-J

最新推荐文章于 2021-07-12 15:00:50 发布

阅读量191

点赞数

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39493070/article/details/104479009

版权

深度学习专栏收录该内容

18 篇文章 0 订阅

订阅专栏

目录

1.1优化在深度学习中的挑战

2.1梯度下降法--GD

2.2随机梯度下降---SGD

2.3小批量随机梯度下降---mini-SGD

2.4 SGD Momentum

lastDay

凸优化；梯度下降；优化算法进阶；

1.凸优化

1.1优化在深度学习中的挑战

局部最小值
鞍点
梯度消失

2.梯度下降

2.1梯度下降法--GD

假设有n个样本，batch_size=n

存在问题：容易陷入局部极小值

时间复杂度O(n)

def f(x):
    return x**2  # Objective function

def gradf(x):
    return 2 * x  # Its derivative

def gd(eta):
    x = 10
    results = [x]
    for i in range(10):
        x -= eta * gradf(x)
        results.append(x)
    print('epoch 10, x:', x)
    return results

res = gd(0.2)

2.2随机梯度下降---SGD

假设有n个样本，batch_size=1

缺点：存在震荡，抖动

时间复杂度：O(1)

2.3小批量随机梯度下降---mini-SGD

假设有n个样本，batch_size=m(小批量m个)

时间复杂度O(m)

2.4 SGD Momentum

ill-conditioned

由指数加权移动平均（exponential moving average）理解动量法

2.5 AdaGrad

根据自变量在每个维度的梯度值的大小来调整各个维度上的学习率，从而避免统一的学习率难以适应所有维度的问题

2.6 RMSProp

相当于 AdaGrad+expotential moving average

2.7 AdaDelta

对RMSProp的改进

2.8 Adam

相当于RMSProp+Momentum

下一篇动手学深度学习PyTorch版---lastDay_2

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。