【代码】详解IDX-Ubyte文件格式及 python读取

最新推荐文章于 2024-04-26 10:57:38 发布

阿卧鹅

最新推荐文章于 2024-04-26 10:57:38 发布

阅读量4.1w

点赞数 36

分类专栏：神经网络文章标签： mnist python 神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_20936739/article/details/82011320

版权

神经网络专栏收录该内容

5 篇文章 2 订阅

订阅专栏

文件下载地址：

官网

http://yann.lecun.com/exdb/mnist/

百度云

原来的链接挂掉了，这是最新的链接

链接: https://pan.baidu.com/s/17XEAenW2RejJ1sQ_3cC5Eg 提取码: kfkx

复制这段内容后打开百度网盘手机App，操作更方便哦

1.Mnist数据集包括四个文件

train-images-idx3-ubyte.gz: 训练集图像(9912422 bytes)
train-labels-idx1-ubyte.gz: 训练集标签 (28881 bytes)
t10k-images-idx3-ubyte.gz: 测试集图像 (1648877 bytes)
t10k-labels-idx1-ubyte.gz: 测试集标签 (4542 bytes)

gz是压缩文件，首先要解压这些文件。

idx3的数字表示数据维度。也就是图像为3维，标签维1维。

图像的3个维度分别为：训练集图像28pix*28pix*60000张测试机 28pix*28pix*10000张。

2 Mnist的格式解析

拿官网上的训练集标签来分析：

首先，offset是偏置，实际上就是一个标号，记录这个字段起始位置在这串数据的第几个字节。拿第一行举例子，从0000的位置开始，（这个0000是16进制，每个16进制位表示是4bit），从0000开始到0003结束，实际上是4字节 = 32bit，所以可以看到这个offset字段的数据类型type是32位整数。这个字段数据为0000 0801 用十进制来说就是2049。description是这个字段数据的含义，这个字段存放的801（也就是十进制2049），意思是魔数（magic number），大概就是确定数据类型的一个标志，是随便设定的，有兴趣的贴个知乎链接，讲魔数的。

用sublime打开这个ubyte文件。

第一个数据为32位，读取前32bit，00000801（即8*4bit=32bit）

第二个数据也是32位，继续读取32bit，0000ea60（十进制60000）

从第三个数据开始，就是真正要用的标签了。类型是无符号数，是1个字节，往后读两个数字，即05.

可以看出这一行数据数据存放的标签以此为5，0，4，1，9，0，2，1，3

对于图像数据

唯一的区别在于，每个无符号数表示一个像素，可以根据description看出，图像是28*28的，往后每28*28个像素位为一幅图像。读取出来是一行数据，之后恢复成方形矩阵就可以了。

3.Mnist的读取

代码可以在百度云直接下载~

关注

36
点赞
踩
149

收藏

觉得还不错? 一键收藏
22
评论
【代码】详解IDX-Ubyte文件格式及 python读取

文件下载地址：官网http://yann.lecun.com/exdb/mnist/百度云原来的链接挂掉了，这是最新的链接链接: https://pan.baidu.com/s/17XEAenW2RejJ1sQ_3cC5Eg 提取码: kfkx复制这段内容后打开百度网盘手机App，操作更方便哦1.Mnist数据集包括四个文件train-images-idx3-uby...
复制链接

扫一扫

专栏目录

评论 22

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。