AdaGrad（自适应梯度算法），Adaptive

最新推荐文章于 2023-12-04 17:32:14 发布

我是小杨我就这样

最新推荐文章于 2023-12-04 17:32:14 发布

阅读量1.4w

点赞数 12

分类专栏：深度学习入门

本文链接：https://blog.csdn.net/weixin_44478378/article/details/101167706

版权

深度学习入门专栏收录该内容

45 篇文章 19 订阅

订阅专栏

学习衰减率：
随着学习的进行，使得学习率逐渐减小。AdaGrad会为参数的每个元素适当的体哦阿正学习率

在这里插入图片描述

# coding： utf-8
import numpy as np


class AdaGrad:
    def __init__(self, learning_rate=0.01):
        self.learning_rate = learning_rate
        self.h = None

    def update(self, params, grads):
        if self.h is None:
            self.h = {}
            for key, value in params.items():
                self.h[key] = np.zeros_like(value)

        for key in params.keys():
            self.h[key] += grads[key] * grads[key]
            params[key] -= self.learning_rate * grads[key] / (np.sqrt(self.h[key]) + 1e-07) # 1e-07微小值避免分母为0