Bag of Tricks for Image Classification with Convolutional Neural Networks CVPR 2019 paper阅读

论文地址:Bag of Tricks for Image Classification with Convolutional Neural Networks CVPR 2019 paper

1 介绍

  • 本篇论文所提到的方法及模型均在Python第三方库gulon

5 Training Refinements

  • 四个技巧

5.1 余弦学习率递减

  • learning rate warmup之后

  • η t = 1 2 ( 1 + c o s ( t π T ) ) η \eta_t=\frac{1}{2}(1+cos(\frac{t\pi}{T}))\eta ηt=21(1+cos(Ttπ))η

  • 疑问:依下图,不应该选step decay更好吗?

在这里插入图片描述

5.2 Label Smoothing

5.3 知识蒸馏

  • teacher model(often pre-trained model), student model

5.4 Mixup Training

  • 是一种数据增强方法

  • x ^ = λ x i + ( 1 − λ ) x i \hat{x} = \lambda x_i+(1-\lambda)x_i x^=λxi+(1λ)xi

  • y ^ = λ y i + ( 1 − λ ) y i \hat{y} = \lambda y_i+(1-\lambda)y_i y^=λyi+(1λ)yi

  • 随机选取两个样本带入上面公式以生成新样本,其中 λ ∈ [ 0 , 1 ] \lambda\in [0, 1] λ[0,1]服从 B e t a ( α , α ) Beta(\alpha, \alpha) Beta(α,α)分布

5.5 实验结果

  • 在知识蒸馏中,选取teacher model最好选取与student model同质(from the same family of the student)

6 迁移学习

7 总结

模型结构、数据处理、损失函数、学习率,stacking它们可以获得一个更好的结果。预训练模型锦上添花。还有一些对硬件的调整。

率,stacking它们可以获得一个更好的结果。预训练模型锦上添花。还有一些对硬件的调整。

待续未完。。。。。。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值