图像分类经典项目：基于开源数据集Fashion-MNIST的应用实践

最新推荐文章于 2024-08-18 09:54:23 发布

Datawhale

最新推荐文章于 2024-08-18 09:54:23 发布

阅读量2.6k

点赞数 1

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Datawhale/article/details/105085526

版权

本文介绍了基于Fashion-MNIST数据集的图像分类项目，使用ResNet34、EfficientNet和WideResNet等模型，结合数据增强、训练技巧，实现了96.21%的准确率。探讨了WarmUp、Ranger优化器、随机擦除等策略的效果，并提供了开源框架。

摘要由CSDN通过智能技术生成

Datawhale

作者：何新，Datawhale优秀学习者

简介：何新，武汉理工大学硕士

https://github.com/whut2962575697

图像分类是计算机视觉和数字图像处理的一个基本问题。传统的图像分类方法通过人工设计提取图像特征，而基于深度学习的图像分类方法能够自动提取特征，其中卷积神经网络(CNN)近年来取得了惊人的成绩。

本文收集并评估了一些高效有用的图像分类训练技巧。使用这些技巧，在开源Fashion-MNIST数据集上达到了96.21%的Acc，为大家提供了一个简单有效的深度卷积神经网络的图像分类Baseline。

简介

问题

针对Fashion-MNIST数据集，设计、搭建、训练机器学习模型，能够尽可能准确地分辨出测试数据的标签。

思路

近年来，虽然许多start-of-art的方法都是通过设计复杂高效的网络结构来实现的，但是有些文献中对一些高效的数据增强方法以及训练技巧都简略的带过。

本文并未提出新颖的网络结构或者数据增强方法，而是对标准的Baseline使用了一些数据增强和训练的技巧得到了一个强Baseline。

目标

将得到的强Baseline在开源的Fashion-MNIST数据集对这些技巧进行了评估，并取得了96.21%的Acc。针对不同阶段的学习者，阅读文章后的收获：

深度学习入门学习者：希望你对当前一些优秀tricks和models有一定的了解；
深度学习竞赛者，希望提供一个简单高效图像分类技巧的工具集；
深度学习研究者：希望提供一个强Baseline，作为取得更高准确率的一个基准；

Baseline详见：

https://github.com/whut2962575697/image_classification

Datawhale后台回复关键词图像分类可打包下载baseline及数据集

数据集

MNIST

相信大家对经典的MNIST数据集都不陌生，它包含了大量的手写数字，可谓是算法工作者的必测数据集之一。有人曾调侃道："如果一个算法在MNIST不work, 那么它就根本没法用；而如果它在MNIST上work, 它在其他数据上也可能不work！"

数据下载：http://yann.lecun.com/exdb/mnist/

最低0.47元/天解锁文章

关注

1
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。