图像分类经典项目:基于开源数据集Fashion-MNIST的应用实践

本文介绍了基于Fashion-MNIST数据集的图像分类项目,使用ResNet34、EfficientNet和WideResNet等模型,结合数据增强、训练技巧,实现了96.21%的准确率。探讨了WarmUp、Ranger优化器、随机擦除等策略的效果,并提供了开源框架。
摘要由CSDN通过智能技术生成

Datawhale

作者:何新,Datawhale优秀学习者

简介:何新,武汉理工大学硕士

https://github.com/whut2962575697

图像分类是计算机视觉和数字图像处理的一个基本问题。传统的图像分类方法通过人工设计提取图像特征,而基于深度学习的图像分类方法能够自动提取特征,其中卷积神经网络(CNN)近年来取得了惊人的成绩。

本文收集并评估了一些高效有用的图像分类训练技巧。使用这些技巧,在开源Fashion-MNIST数据集上达到了96.21%的Acc,为大家提供了一个简单有效的深度卷积神经网络的图像分类Baseline。

简介

问题

针对Fashion-MNIST数据集,设计、搭建、训练机器学习模型,能够尽可能准确地分辨出测试数据的标签。

思路

近年来,虽然许多start-of-art的方法都是通过设计复杂高效的网络结构来实现的,但是有些文献中对一些高效的数据增强方法以及训练技巧都简略的带过。

本文并未提出新颖的网络结构或者数据增强方法,而是对标准的Baseline使用了一些数据增强和训练的技巧得到了一个强Baseline。

目标

将得到的强Baseline在开源的Fashion-MNIST数据集对这些技巧进行了评估,并取得了96.21%的Acc。针对不同阶段的学习者,阅读文章后的收获:

  • 深度学习入门学习者:希望你对当前一些优秀tricks和models有一定的了解;

  • 深度学习竞赛者,希望提供一个简单高效图像分类技巧的工具集;

  • 深度学习研究者:希望提供一个强Baseline,作为取得更高准确率的一个基准;

Baseline详见:

https://github.com/whut2962575697/image_classification

Datawhale后台回复关键词 图像分类 可打包下载baseline及数据集

数据集

MNIST

相信大家对经典的MNIST数据集都不陌生,它包含了大量的手写数字,可谓是算法工作者的必测数据集之一。有人曾调侃道:"如果一个算法在MNIST不work, 那么它就根本没法用;而如果它在MNIST上work, 它在其他数据上也可能不work!"

数据下载:http://yann.lecun.com/exdb/mnist/

1. Caltech-UCSD Birds-200-2011: 包含200种鸟类共约11,000张图像,每种鸟类有约50张图像。该数据集已经被广泛应用图像分类、物体检测、图像分割等领域的研究。 2. CIFAR-10/100: CIFAR-10包含10个类别共60,000张32x32的彩色图像,每个类别有6,000张图像。CIFAR-100包含100个类别,每个类别包含600张图像。这些数据集已经成为图像分类领域的基准数据集。 3. ImageNet: ImageNet是一个庞大的图像数据库,包含超过1,000万张图像,涵盖了超过20,000种物体类别。该数据集已经成为计算机视觉领域的重要基准数据集,被广泛应用图像分类、物体检测、图像分割等领域的研究。 4. Oxford-IIIT Pet Dataset: 包含12种不同的宠物类别共7,349张图像。该数据集已经被广泛应用图像分类、物体检测、图像分割等领域的研究。 5. PASCAL VOC: PASCAL VOC 数据集包含20个物体类别,每个类别有训练集和测试集各4,952张图像。该数据集已经成为计算机视觉领域的重要基准数据集,被广泛应用于物体检测、图像分割等领域的研究。 6. Stanford Dogs Dataset: 包含120个不同品种的狗共20,580张图像。该数据集已经被广泛应用图像分类、物体检测、图像分割等领域的研究。 7. Stanford Cars Dataset: 包含196个不同品牌的汽车共16,185张图像。该数据集已经被广泛应用图像分类、物体检测、图像分割等领域的研究。 8. CUB-200-2011: 包含200种鸟类共约11,000张图像,每种鸟类有约50张图像。该数据集已经被广泛应用图像分类、物体检测、图像分割等领域的研究。 9. Fashion-MNIST: 包含10个类别共70,000张28x28的灰度图像,该数据集被广泛应用图像分类领域的研究。 10. MNIST: 包含10个类别共70,000张28x28的灰度图像,该数据集被广泛应用于手写数字识别的研究。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值