深度学习实践技巧

最新推荐文章于 2022-06-10 21:05:58 发布

墨奕ccccc

最新推荐文章于 2022-06-10 21:05:58 发布

阅读量230

点赞数

分类专栏：深度学习基础

本文链接：https://blog.csdn.net/qq_38289169/article/details/107576832

版权

深度学习基础专栏收录该内容

1 篇文章 0 订阅

订阅专栏

学习率的选择与切换：

初期Adam,后期SGD，切换方法参考：Improving Generalization Performance by Switching from Adam to SGD
首先来看第1个问题，切换之后用什么样的学习率。
Adam的下降方向是
$n^{Adam}_t = (\alpha/\sqrt{V_t})*m_t$
而SGD的下降方向是.
$n^{SGD}_t = \alpha^{SGD}\cdot g_t$
, $n^{SGD}_t$ 必定可以分解为 $n^{Adam}_t$ 所在方向及其正交方向上的两个方向之和，那么其在 $n^{Adam}_t$ 方向上的投影就意味着SGD在Adam算法决定的下降方向上前进的距离，而在 $n^{Adam}_t$ 的正交方向上的投影是 SGD 在自己选择的修正方向上前进的距离。

图片来自原文，这里p为Adam下降方向，g为梯度方向，r为SGD的学习率。如果SGD要走完Adam未走完的路，那就首先要接过Adam的大旗——沿着 $n^{Adam}_t$ 方向走一步，而后在沿着其正交方向走相应的一步。这样我们就知道该如何确定SGD的步长（学习率）了——SGD在Adam下降方向上的正交投影，应该正好等于Adam的下降方向（含步长）。也即：
$proj_{n^{SGD}_t} =n^{Adam}_t$
解这个方程，我们就可以得到接续进行SGD的学习率：
$\alpha_t^{SGD}=((n_t^{Adam})^Tn_t^{Adam})/((n_t^{Adam})^Tg_t)$ 为了减少噪声影响，作者使用移动平均值来修正对学习率的估计：
$\lambda_t^{SGD}=\beta_2\cdot\lambda_{t-1}^{SGD}+(1-\beta_2)\alpha_t^{SGD}$
$\tilde{\lambda}^{SGD}_t =\lambda_t^{SGD}/(1-\beta_2^t)$ 这里直接复用了Adam的 $\beta_2$ 参数。然后来看第一个问题，何时进行算法的切换。作者的回答也很简单，那就是当 SGD的相应学习率的移动平均值基本不变的时候，即： $|\tilde{\lambda}^{SGD}_t-\alpha_t^{SGD}|<\epsilon$
每次迭代玩都计算一下SGD接班人的相应学习率，如果发现基本稳定了，那就SGD以 $\tilde{\lambda}^{SGD}_t$ 为学习率接班前进。

使用方法

pip install pytorch-swats


import swats

optimizer = swats.SWATS(model.parameters())
data_loader = torch.utils.data.DataLoader(...)

for epoch in range(10):
    for inputs, targets in data_loader:
        # deleting the stored grad values
        optimizer.zero_grad()

        outputs = model(inputs)
        loss = loss_fn(outputs, targets)
        loss.backward()

        # performing parameter update
        optimizer.step()

其他小技巧

先用小数据集进行实验。
数据集一定要充分的打散（shuffle）。这样在使用自适应学习率算法的时候，可以避免某些特征集中出现，而导致的有时学习过度、有时学习不足，使得下降方向出现偏差的问题。
在语义分割任务时可使用lovasa-loss
lovasa-loss
如果上述学习率效果差，可考虑换为warm restart 学习率：
Cosine Annealing w. Snapshot Ensemble

CYCLE=8000
LR_INIT=0.
1LR_MIN=0.001
scheduler = lambda x: ((LR_INIT-LR_MIN)/2)*(np.cos(PI*(np.mod(x-1,CYCLE)/(CYCLE)))+1)+LR_MIN

墨奕ccccc

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录