Datawhale
作者:何新,Datawhale优秀学习者
简介:何新,武汉理工大学硕士
https://github.com/whut2962575697
图像分类是计算机视觉和数字图像处理的一个基本问题。传统的图像分类方法通过人工设计提取图像特征,而基于深度学习的图像分类方法能够自动提取特征,其中卷积神经网络(CNN)近年来取得了惊人的成绩。
本文收集并评估了一些高效有用的图像分类训练技巧。使用这些技巧,在开源Fashion-MNIST数据集上达到了96.21%的Acc,为大家提供了一个简单有效的深度卷积神经网络的图像分类Baseline。
简介
问题
针对Fashion-MNIST数据集,设计、搭建、训练机器学习模型,能够尽可能准确地分辨出测试数据的标签。
思路
近年来,虽然许多start-of-art的方法都是通过设计复杂高效的网络结构来实现的,但是有些文献中对一些高效的数据增强方法以及训练技巧都简略的带过。
本文并未提出新颖的网络结构或者数据增强方法,而是对标准的Baseline使用了一些数据增强和训练的技巧得到了一个强Baseline。
目标
将得到的强Baseline在开源的Fashion-MNIST数据集对这些技巧进行了评估,并取得了96.21%的Acc。针对不同阶段的学习者,阅读文章后的收获:
深度学习入门学习者:希望你对当前一些优秀tricks和models有一定的了解;
深度学习竞赛者,希望提供一个简单高效图像分类技巧的工具集;
深度学习研究者:希望提供一个强Baseline,作为取得更高准确率的一个基准;
Baseline详见:
https://github.com/whut2962575697/image_classification
Datawhale后台回复关键词 图像分类 可打包下载baseline及数据集
数据集
MNIST
相信大家对经典的MNIST数据集都不陌生,它包含了大量的手写数字,可谓是算法工作者的必测数据集之一。有人曾调侃道:"如果一个算法在MNIST不work, 那么它就根本没法用;而如果它在MNIST上work, 它在其他数据上也可能不work!"
数据下载:http://yann.lecun.com/exdb/mnist/