训练分割网络时的trick

最新推荐文章于 2023-07-02 17:24:24 发布

木绿

最新推荐文章于 2023-07-02 17:24:24 发布

阅读量441

点赞数

分类专栏：图像分割tips

本文链接：https://blog.csdn.net/qq_43232545/article/details/104910239

版权

图像分割tips 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

其实训练我觉得真的是case by case，在task A上用的heuristics放到task B效果就反而没那么好，所以我就介绍一个大多场合下都能用的trick：Cosine Annealing w. Snapshot Ensemble听上去听酷炫的，实际上就是每个一段时间warm restart学习率，这样在单位时间内能得到多个而不是一个converged local minina，做融合的话手上的模型会多很多。放几张图上来感受一下：

在这里插入图片描述
实现的话，其实挺简单的：

CYCLE=8000
LR_INIT=0.1
LR_MIN=0.001
scheduler = lambda x: ((LR_INIT-LR_MIN)/2)*(np.cos(PI*(np.mod(x-1,CYCLE)/(CYCLE)))+1)+LR_MIN

然后每个batch/epoch去用scheduler(iteration)去更新学习率就可以了

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

木绿

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
训练分割网络时的trick

其实训练我觉得真的是case by case，在task A上用的heuristics放到task B效果就反而没那么好，所以我就介绍一个大多场合下都能用的trick：Cosine Annealing w. Snapshot Ensemble听上去听酷炫的，实际上就是每个一段时间warm restart学习率，这样在单位时间内能得到多个而不是一个converged local minina，做融合...
复制链接

扫一扫