mnist数据下载、格式分析与读取

这篇博客介绍了MNIST数据集的下载、格式分析及读取方法。数据包括训练集和测试集的图像文件和标签文件,存储为idx3-ubyte格式。训练集和测试集的图像以28x28像素的灰度图像形式存在,0表示背景(白色),255表示前景(黑色)。读取代码包含详细注释。
摘要由CSDN通过智能技术生成
数据下载

Mnist数据下载地址:http://yann.lecun.com/exdb/mnist/
Mnist数据下载
这四个文件包含了全部的Mnist数据。解压后就会得到idx3-ubyte类型的四个文件。

数据格式分析

idx3-ubyte类型的文件需要处理一下才能读取到python中,在讲解如何读取时,先了解一下mnist数据的存储格式。

  1. TRAINING SET LABEL FILE
    TRAINING SET LABEL FILE
    训练数据的label文件中,前两个32位整数位分别为magic number和item数量,之后的6000个unsigned byte为6000张图像的label,label值范围从0到9。

  2. TRAINING SET IMAGE FILE
    TRAINING SET IMAGE FILE
    Pixels are organized row-wise. Pixel values are 0 to 255. 0 means background (white), 255 means foreground (black).
    前4个32位整型分别为magic number、图片数、行数、列数。后面按顺序有28*28*6000个像素的颜色值,其中0为白,255为黑。也就相当于,每个28像素*28像素的图像被展开,变成了一维的数据,而6000个这样的一维数据拼接,就组成了这个数据。

  3. TEST SET LABEL FILE
    TEST SET LABEL FILE
    与训练数据类似,不过item个数为10000。

  4. TEST SET IMAGE FILE
    TEST SET IMAGE FILE
    Pixels are organized row-wise. Pixel values are 0 to 255. 0 means background

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值