学习率是什么,怎么调整

学习率是机器学习优化算法中的重要参数,它决定了每次迭代时权重更新的步长。合适的 learning rate 能确保模型有效收敛到损失函数的最小值。如果学习率设置过小,收敛速度会变得很慢;而设置过大,则可能导致震荡或错过最小值,无法有效收敛。因此,选择适当的学习率对于模型训练的效率和找到全局最优至关重要。
摘要由CSDN通过智能技术生成

学习率的定义:

Wikipedia给出Learning Rate的定义如下

In machine learning and statistics, the learning rate is a tuning parameter in an optimization algorithm that determines the step size at each iteration while moving toward a minimum of a loss function.
机器学习和统计学中,学习率是优化算法中的调谐参数,该参数可确定确定每次迭代中的步长,使损失函数收敛到最小值

学习率的作用

 

这是来自吴恩达机器学习课程的截图

我们先看一下上面出现的唯一一条公式,公式中的θ就是代表着权重参数,新的θ会由之前的θ计算得来,这个计算过程就是为了寻找目标函数收敛到最小值。那么公式中出现的α就是当下的学习率。

上面两张明显的对比图就给出了学习率过大和过小的情况。

学习率设置过小的时候,每步太小,下降速度太慢,可能要花很长的时间才会找到最小值。

学习率过大过大的时候,每步太大,虽然收敛得速度很快,可能会像图中一样,跨过或忽略了最小值,导致一直来回震荡而无法收敛。

这时我们再通过Loss曲线看一下不同学习率对收敛得的影响

很明显,过小的学习率导致收敛缓慢,过大的学习率一开始收敛速度很快,但会导致无法收敛到最小值,超高的学习率甚至可能直接大幅跨过了最小值而没有收敛效果。

所以选取一个合适的学习率,对于找到全局最小值以及提高模型训练速度都是很有帮助的。

 学习率到底是什么_JeromeYChen的博客-CSDN博客_学习率是什么

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
One Cycle Learning Rate是一种学习率衰减方法,它通过在训练初期使用一个较大的学习率,从而快速地收敛到一个局部最优解,然后在训练后期使用一个较小的学习率,逐步地优化模型[^1]。具体而言,One Cycle Learning Rate方法的学习率变化规则如下: 1. 在训练初期,使用较大的学习率(如初始学习率的10倍),从而快速地收敛到一个局部最优解。 2. 在训练中期,使用较小的学习率,逐步地优化模型。 3. 在训练后期,再次使用较小的学习率,让模型更加稳定。 使用One Cycle Learning Rate方法可以有效地提高模型的训练速度和泛化性能,但需要仔细调整超参数,以避免模型过拟合。 以下是一个使用One Cycle Learning Rate的示例代码: ```python import torch import torch.optim as optim from torch.optim.lr_scheduler import OneCycleLR # 定义模型和优化器 model = ... optimizer = optim.SGD(model.parameters(), lr=0.1, momentum=0.9) # 定义学习率调度器 scheduler = OneCycleLR(optimizer, max_lr=0.1, total_steps=100, epochs=10) # 训练循环 for epoch in range(10): for batch in data_loader: # 前向传播和反向传播 loss = ... optimizer.zero_grad() loss.backward() optimizer.step() # 更新学习率 scheduler.step() ``` 在上述代码中,我们首先定义了模型和优化器。然后,我们使用`OneCycleLR`类创建了一个学习率调度器,并指定了最大学习率、总的训练步数和训练的总epoch数。在训练循环中,我们在每个batch的训练过程中,先进行前向传播和反向传播,然后更新模型参数和学习率
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值