动手学深度学习PyTorch版--大作业--Fashion-mnist分类任务

代码有点长,故放github上了
文件预处理 – 数据准备 – 训练/测试–打印csv表
需要的同学请自取【我的github
Fashion-mnist
经典的MNIST数据集包含了大量的手写数字。十几年来,来自机器学习、机器视觉、人工智能、深度学习领域的研究员们把这个数据集作为衡量算法的基准之一。你会在很多的会议,期刊的论文中发现这个数据集的身影。实际上,MNIST数据集已经成为算法作者的必测的数据集之一。有人曾调侃道:“如果一个算法在MNIST不work, 那么它就根本没法用;而如果它在MNIST上work, 它在其他数据上也可能不work!”

Fashion-MNIST的目的是要成为MNIST数据集的一个直接替代品。作为算法作者,你不需要修改任何的代码,就可以直接使用这个数据集。Fashion-MNIST的图片大小,训练、测试样本数及类别数与经典MNIST完全相同

这个数据集的样子大致如下(每个类别占三行):
类别标注
在Fashion-mnist数据集中,每个训练样本都按照以下类别进行了标注:
在这里插入图片描述

1.任务描述

Fashion-MNIST是一个替代MNIST手写数字集的图像数据集。 它是由Zalando(一家德国的时尚科技公司)旗下的研究部门提供。其涵盖了来自10种类别的共7万个不同商品的正面图片。Fashion-MNIST的大小、格式和训练集/测试集划分与原始的MNIST完全一致。60000/10000的训练测试数据划分,28x28的灰度图片。你可以直接用它来测试你的机器学习和深度学习算法性能,且不需要改动任何的代码。

本次任务需要针对Fashion-MNIST数据集,设计、搭建、训练机器学习模型,能够尽可能准确地分辨出测试数据地标签。

2.文档说明

数据集文件分为训练集和测试集部分,对应文件如下:

  • 训练数据:train-images-idx3-ubyte.gz
  • 训练标签:train-labels-idx1-ubyte.gz
  • 测试数据:t10k-images-idx3-ubyte.gz
  • 测试标签:t10k-labels-idx1-ubyte.gz

3.评估说明

评价指标
本次任务采用 ACC(Accuracy) 作为模型的评价标准。

在线评估
评估函数首先会验证选手提交的预测结果文件是否符合要求,主要验证了以下要求:

提交的预测文件是否存在重复ID
提交的预测文件ID是否与测试集文件ID不匹配
通过验证后的文件会用以ACC为测评指标的函数进行计算评估。

文件格式
由于测评脚本已经统一,为保证脚本的顺利运行,在进行测评时,要求选手提交的预测文件拥有规范的字段名和字段格式,预测文件具体要求如下:
在这里插入图片描述
基准算法
本次任务采用不同的基准算法,获得模型的ACC如下:

  • 随机基准算法ACC:0.09440
  • 弱基准算法ACC:0.90452
    在评估时,以弱基准算法的ACC作为达标线。

4.参考文献

[1] Fashion-MNIST: a Novel Image Dataset for Benchmarking Machine Learning Algorithms. Han Xiao, Kashif Rasul, Roland Vollgraf. arXiv:1708.07747
[2] https://github.com/zalandoresearch/fashion-mnist/

  • 0
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值