pytorch 笔记：torch.optim.Adam

最新推荐文章于 2024-12-13 13:01:26 发布

UQI-LIUWJ

最新推荐文章于 2024-12-13 13:01:26 发布

阅读量1.8k

点赞数 7

分类专栏： pytorch学习文章标签： pytorch 笔记人工智能

本文链接：https://blog.csdn.net/qq_40206371/article/details/140618554

版权

torch.optim.Adam 是一个实现 Adam 优化算法的类。
Adam 是一个常用的梯度下降优化方法，特别适合处理大规模数据集和参数的深度学习模型

torch.optim.Adam(
    params, 
    lr=0.001, 
    betas=(0.9, 0.999), 
    eps=1e-08, 
    weight_decay=0, 
    amsgrad=False, 
    *, 
    foreach=None, 
    maximize=False, 
    capturable=False, 
    differentiable=False, 
    fused=None)

params	待优化参数的可迭代对象，或定义参数组的字典
lr	学习率，默认为 1e-3
betas	用于计算梯度及其平方的移动平均的系数，默认为 (0.9, 0.999)
eps	为了提高数值稳定性而添加到分母的项，默认为 1e-8
weight_decay	权重衰减（L2惩罚），默认为 0
amsgrad	是否使用 AMSGrad 变种，该变种来源于论文 "On the Convergence of Adam and Beyond"，默认为 False
fore