我们知道在实际训练中学习率最好是能够动态变化的。一般情况下,我们希望学习率一开始比较高,因为一开始训练的时候我们需要更快的学习速度,梯度下降法能够更快的帮助我们的模型参数到达一个比较好的值。但是当模型训练到一定程度后,学习速度能够降下来,相当于那个时候的训练会是一个微调训练的过程。pytorch中的lr_sheduler就满足了我们这样的需求
pytorch中lr_scheduler的使用
最新推荐文章于 2024-07-10 14:39:48 发布
我们知道在实际训练中学习率最好是能够动态变化的。一般情况下,我们希望学习率一开始比较高,因为一开始训练的时候我们需要更快的学习速度,梯度下降法能够更快的帮助我们的模型参数到达一个比较好的值。但是当模型训练到一定程度后,学习速度能够降下来,相当于那个时候的训练会是一个微调训练的过程。pytorch中的lr_sheduler就满足了我们这样的需求