paddlepaddle 26 同时具备周期性与衰减性的学习率调度器

57 篇文章 87 订阅 ¥59.90 ¥99.00
本文介绍了如何结合周期性与衰减性学习率调度器,以利用它们各自的优势。作者修改了余弦退火重启动和余弦式衰减学习率的代码,实现了一个新的调度器,旨在帮助模型跳出局部最小值并有效训练。
摘要由CSDN通过智能技术生成

在我们熟知的学习率调度器中,有周期性调度器(单周期,多周期),也由衰减式调度器(按性能衰减,按epoch衰减)和预热式(学习率变化为低->高->缓慢变低)的。

周期性调度器对学习率比较敏感,可以通过学习率的周期性变化跳出局部最小值(在局部最小值时,学习率上升,有一定概率跳出最小值),尽可能找到鞍点;衰减式调度器,对学习率敏感度较低,但很难越过局部最小值(因为其学习率在不断下降,当到达鞍点时没有足够的动量跃出鞍点)。

为了结合这两个调度器的优势,博主对现行公开的两种学习率周期性调度器(余弦退火重启动学习率和余弦式衰减学习率)的代码做了轻微修改,实现了周期性与衰减学习率调度器的结合。

1、余弦退火重启动学习率衰减

由于paddle默认的学习率调度器里没有余弦退火重启动学习率,因此需要自习进行实现。

这里只实现了指数式衰减,参数中的eta_min是学习率最小值。

class CosineAnnealingWarmRestarts2(lr.LRScheduler):
    #learning_rate:最大学习率值
    #eta_min:最小学习率值
    def __init__(self, m
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

万里鹏程转瞬至

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值