adam函数 python_深度学习中的优化算法（Optimizer）理解与python实现

最新推荐文章于 2024-06-30 22:00:20 发布

书看不完了

最新推荐文章于 2024-06-30 22:00:20 发布

阅读量6.6k

点赞数 5

文章标签： adam函数 python

本文链接：https://blog.csdn.net/weixin_35763055/article/details/112537066

版权

本文详细介绍了深度学习中常用的优化算法，包括SGD、Momentum、Nesterov、AdaGrad、RMSprop和Adam，通过Python代码展示了它们的实现过程，帮助读者理解并掌握这些算法的运作原理。

摘要由CSDN通过智能技术生成

本篇笔记将介绍深度学习中几种优化算法，SGD，Momentum，Nestrov，AdaGrad，RMSprop和Adam的理解以及简单的python实现

一、SGD

随机梯度下降法不用多说，每一个参数按照梯度的方向来减小以追求最小化损失函数

更新方式

Python实现

class SGD: 
    def __init__(self, lr=0.01):
        self.lr = lr

    def update(self, params, grads):
        for key in params.keys():
            params[key] -= self.lr * grads[key]

二、Momentum

在梯度下降的基础上加入了动量，即前面的梯度将会影响本轮的梯度方向

更新方式

Python实现

class Momentum:
    def __init__(self, lr=0.01, momemtum=0.9):
        self.lr = lr
        self.momemtum = momemtum
        self.v = None

    def update(self, params, grads):
        if self.v is None:
            self.v = {}
            for key, val in params.items():
                self.v[key] = np.zeros_like(val)

        for key in params.keys():
            self.v[key] = self.momemtum * self.v[key] - self.lr * grads[key]
            params[key] += self.v[key]

三、Nestrov

Nestrov也是一种动量更新的方式，但是与普通动量方式不同的是，Nestrov为了加速收敛，提前按照之前的动量走了一步，然后求导后按着梯度再走一步

最低0.47元/天解锁文章

书看不完了

关注

5
点赞
踩
38

收藏

觉得还不错? 一键收藏
0
评论
adam函数 python_深度学习中的优化算法（Optimizer）理解与python实现

本篇笔记将介绍深度学习中几种优化算法，SGD，Momentum，Nestrov，AdaGrad，RMSprop和Adam的理解以及简单的python实现一、SGD随机梯度下降法不用多说，每一个参数按照梯度的方向来减小以追求最小化损失函数更新方式Python实现class SGD: def __init__(self, lr=0.01): self.lr = lr ...
复制链接

扫一扫