pytorch 常用5种学习率策略

本文介绍了PyTorch中常用的五种学习率衰减策略,包括固定步长、多步长、余弦衰减、余弦热身和指数衰减。详细阐述了每种策略的参数及其作用,如step_size、milestones、T_max、eta_min等,强调了余弦衰减策略的重要性。
摘要由CSDN通过智能技术生成

固定步长衰减策略

参数

step_szie:表示每隔多少个步长修改一次(训练的时候表示每隔多少个epoch修改一次)

gamma:0.1 表示每一次修改采用 lr_new = lr_old * gamma

optimizer = torch.optim.SGD(model.parameters(), lr=0.01)
scheduler_StepLR = torch.optim.lr_scheduler.StepLR(optimizer, step_size=10, gamma=0.9)

固定步长衰减策略

多步长衰减策略

参数

milestones 表示在哪个步长时衰减(epoch)

gamma 同上

optimizer = torch
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值