（十一）pytorch学习笔记---内容为学习资源摘录整合の梯度下降方法--Adam（6）

最新推荐文章于 2024-04-23 23:55:42 发布

weixin_40245436

最新推荐文章于 2024-04-23 23:55:42 发布

阅读量341

点赞数

分类专栏： pytorch学习笔记啊文章标签： pytorch Adam

本文链接：https://blog.csdn.net/weixin_40245436/article/details/86722933

版权

本文介绍了Adam优化算法，它是动量法和RMSProp的结合，适用于深度学习模型的训练。文章提供了Adam算法的实现，并通过MNIST数据集展示了其在神经网络训练中的应用，对比了自定义实现与PyTorch内置实现的效果。

摘要由CSDN通过智能技术生成

Adam

Adam 是一个结合了动量法和 RMSProp 的优化算法，其结合了两者的优点。

Adam 算法

下面我们来实现以下 adam 算法

def adam(parameters, vs, sqrs, lr, t, beta1=0.9, beta2=0.999):
eps = 1e-8
for param, v, sqr in zip(parameters, vs, sqrs):
v[:] = beta1 * v + (1 - beta1) * param.grad.data
sqr[:] = beta2 * sqr + (1 - beta2) * param.grad.data ** 2
v_hat = v / (1 - beta1 ** t)
s_hat = sqr / (1 - beta2 ** t)
param.data = param.data - lr * v_hat / torch.sqrt(s_hat + eps)

import numpy as np
import torch
from torchvision.datasets import MNIST # 导入 pytorch 内置的 mnist 数据
from torch.utils.data import DataLoader
from torch import nn

最低0.47元/天解锁文章

weixin_40245436

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
（十一）pytorch学习笔记---内容为学习资源摘录整合の梯度下降方法--Adam（6）

AdamAdam 是一个结合了动量法和 RMSProp 的优化算法，其结合了两者的优点。Adam 算法下面我们来实现以下 adam 算法def adam(parameters, vs, sqrs, lr, t, beta1=0.9, beta2=0.999): eps = 1e-8 for param, v, sqr in zip(parameters, vs,...
复制链接

扫一扫

专栏目录