Bag of Tricks for Image Classification with Convolutional Neural Networks【浅读】

最新推荐文章于 2024-05-11 09:17:15 发布

幽殇默

最新推荐文章于 2024-05-11 09:17:15 发布

阅读量255

点赞数 5

分类专栏：论文阅读文章标签：人工智能深度学习

本文链接：https://blog.csdn.net/bettle_king/article/details/138141509

版权

论文阅读专栏收录该内容

65 篇文章 0 订阅

订阅专栏

Bag of Tricks for Image Classification with Convolutional Neural Networks

Bag of Tricks for Image Classification with Convolutional Neural Networks(卷积神经网络图像分类的技巧包)

GitHub - dmlc/gluon-cv: Gluon CV Toolkit

摘要

最近在图像分类研究中取得的许多进展可以归功于训练过程的改进，例如数据增强和优化方法的变化。然而，在文献中，大多数改进要么作为实现细节简要地提到，要么只在源代码中可见。在本文中，我们将研究这些改进的集合，并通过烧蚀研究经验评估它们对最终模型精度的影响。我们将证明，通过将这些改进结合在一起，我们能够显著改进各种CNN模型。例如，我们将ResNet-50在ImageNet上的前1验证准确率从75.3%提高到79.29%。我们还将证明，图像分类精度的提高会在其他应用领域(如对象检测和语义分割)中带来更好的迁移学习性能。

总结

主要就是一些小的trick：

数据增强：使用label smoothing, mixup等方法进行数据增强。
模型调整：调整卷积层的步长、卷积核大小等参数。如ResNet-B、ResNet-C、ResNet-D等。
训练过程优化：使用cosine学习率衰减、大batch训练、低精度训练等技术。
知识蒸馏：使用教师模型帮助训练学生模型。
调整损失函数：使用label smoothing调整交叉熵损失函数。
调整学习率：使用cosine学习率衰减、线性缩放学习率等技术。
调整训练轮数：增加训练轮数。
调整验证集：使用验证集进行早停等。
调整初始化：使用零初始化、均匀分布初始化等技术。
调整正则化：只对权重进行L2正则化等

幽殇默

关注

5
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Bag of Tricks for Image Classification with Convolutional Neural Networks【浅读】

最近在图像分类研究中取得的许多进展可以归功于训练过程的改进，例如数据增强和优化方法的变化。然而，在文献中，大多数改进要么作为实现细节简要地提到，要么只在源代码中可见。在本文中，我们将研究这些改进的集合，并通过烧蚀研究经验评估它们对最终模型精度的影响。我们将证明，通过将这些改进结合在一起，我们能够显著改进各种CNN模型。例如，我们将ResNet-50在ImageNet上的前1验证准确率从75.3%提高到79.29%。
复制链接

扫一扫