学习速率搜索

最新推荐文章于 2024-08-21 10:10:54 发布

suredied

最新推荐文章于 2024-08-21 10:10:54 发布

阅读量689

点赞数 1

分类专栏： Fun with AI 文章标签：深度学习学习速率

本文链接：https://blog.csdn.net/suredied/article/details/113442081

版权

Fun with AI 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

学习速率是训练DNN模型的一个关键参数。过大的学习速率设置会导致训练过程不收敛，过小的学习速率会导致收敛速度缓慢。本篇博客将介绍一种现有论文中的学习速率的选取方法。

这种方法作为一种最佳实践，也被Fast AI库所采纳。博主的初衷是使用Fast AI所提供的API，便捷地实现这种搜索方法。但在实践过程中却发现Fast AI已经从1.0版本升级到了2.0版本，其很多功能的实现方式发生了变化。之前博主基于Fast AI 1.0所探讨的一些扩展技能都不再适用。有鉴于此，为避免Fast AI版本变更导致的技能点失效，本篇博文不但将介绍基于Fast AI的懒人方法，还将介绍其具体步骤。如此，基于naive的pytorch的实现也很easy。

博文主要内容如下：第一部分将给出学习速率选取方法的流程图，并论述实现过程中所需注意的要点。第二部分将介绍如何在自定义的应用场景中使用Fast AI的相关方法。第三部分给出了不同实现方式的结果。最后将给出相关的参考链接。

一、学习速率搜索方法

方法流程图及注意要点如下图所示，其基本流程是设置不同的学习速率，每个学习速率训练一个batch，由loss值的变化趋势来选取合适的学习速率。

图 1. 学习速率搜索流程

二、`Fast AI`中的`lr_find()`

Fast AI中的lr_find()的方法，是关联于Learner对象的。为在自定义应用场景中使用lr_find()方法，我们需要将自定义的data、model、loss function、optimizer等深度学习所需要素封装为Learner对象。

1. 将`pytorch`的`Dataset`转换为`Fast AI`的`Dataloaders`

data = DataLoaders.from_dsets(train_ds, valid_ds, bs=128).cuda()

注意：batch_size参数的默认值为64。

2. 将`pytorch`的`optim`实例转换为`Fast AI`的`loss_func`

# ps: param_set.
def opt_func(ps, lr): return OptimWrapper(optim.SGD(ps, lr=lr, momentum=0.9, weight_decay=1E-4))

3. 构建`Fast AI`的`Learner`对象

# criterion is same as the conventional loss functions in pytorch
learn = Learner(data, model, loss_func=criterion, opt_func=opt_func, metrics=accuracy)