论文地址:Bag of Tricks for Image Classification with Convolutional Neural Networks CVPR 2019 paper
文章目录
1 介绍
- 本篇论文所提到的方法及模型均在Python第三方库
gulon
。
5 Training Refinements
- 四个技巧
5.1 余弦学习率递减
-
在
learning rate warmup
之后 -
η t = 1 2 ( 1 + c o s ( t π T ) ) η \eta_t=\frac{1}{2}(1+cos(\frac{t\pi}{T}))\eta ηt=21(1+cos(Ttπ))η
-
疑问:依下图,不应该选
step decay
更好吗?
5.2 Label Smoothing
5.3 知识蒸馏
- teacher model(often pre-trained model), student model
5.4 Mixup Training
-
是一种数据增强方法
-
x ^ = λ x i + ( 1 − λ ) x i \hat{x} = \lambda x_i+(1-\lambda)x_i x^=λxi+(1−λ)xi
-
y ^ = λ y i + ( 1 − λ ) y i \hat{y} = \lambda y_i+(1-\lambda)y_i y^=λyi+(1−λ)yi
-
随机选取两个样本带入上面公式以生成新样本,其中 λ ∈ [ 0 , 1 ] \lambda\in [0, 1] λ∈[0,1]服从 B e t a ( α , α ) Beta(\alpha, \alpha) Beta(α,α)分布
5.5 实验结果
- 在知识蒸馏中,选取
teacher model
最好选取与student model
同质(from the same family of the student)
6 迁移学习
7 总结
模型结构、数据处理、损失函数、学习率,stacking
它们可以获得一个更好的结果。预训练模型锦上添花。还有一些对硬件的调整。
率,stacking
它们可以获得一个更好的结果。预训练模型锦上添花。还有一些对硬件的调整。
待续未完。。。。。。