解析MNIST数据集

最新推荐文章于 2024-06-12 15:46:11 发布

嵌入式常工匠

最新推荐文章于 2024-06-12 15:46:11 发布

阅读量896

点赞数

分类专栏： paddlepaddle 文章标签： MNIST 图像处理机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/aLife2P6/article/details/103609890

版权

机器学习的入门，一般都是从MNIST数据库上进行手写识别开始的。MNIST数据集作为一个简单的计算机视觉数据集，包含一系列手写数字图片和对应的标签。图片是28x28的像素矩阵，标签则对应着0~9的10个数字。每张图片都经过了大小归一化和居中处理。而MNIST数据库的文件格式是IDX格式，常见的计算机软件无法识别，参考《使用Python解析MNIST数据集（IDX文件格式）》，改编出一个程...

摘要由CSDN通过智能技术生成

机器学习的入门，一般都是从MNIST数据库上进行手写识别开始的。

MNIST数据集作为一个简单的计算机视觉数据集，包含一系列手写数字图片和对应的标签。图片是28x28的像素矩阵，标签则对应着0~9的10个数字。每张图片都经过了大小归一化和居中处理。

而MNIST数据库的文件格式是IDX格式，常见的计算机软件无法识别，参考《使用Python解析MNIST数据集（IDX文件格式）》，改编出一个程序，可以直观看出图像和标签。我的调试环境：win10/Anaconda3/Jupyter Notebook/Python3

=====================

IDX文件的格式

基本格式如下：

幻数(magic number)
0维的大小
1维的大小
2维的大小
...
N维的大小
数据(data)...

幻数是最高位有效位在前(MSB firt)的四字节整型数。

前两个字节为0。

第三个字节指明了数据(the data)的类型：
0x08 无符号的字节型 (8bit)
0x09 有符号的字节型 (8bit)
0x0B 短整型 (16bit)
0x0C 整型 (32bit)
0x0D 浮点型 (32bit)
0x0E 双精度浮点型 (64bit)

第四个字节指明向量或矩阵的维度：
1 向量
2 矩阵
...

每一个维度的大小都用4字节的整型数表示。最高有效位在前（MSB first）、大端(high endian)。

数据(the data)向C语言中的数组一样存储。例如，最后一维的变化最快。

=============================================================================

闲话少叙，书归正传，下面开练。

传统开场白

导入需要的模块

我已经将训练集和测试集的四个文件从

最低0.47元/天解锁文章

嵌入式常工匠

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
解析MNIST数据集

机器学习的入门，一般都是从MNIST数据库上进行手写识别开始的。MNIST数据集作为一个简单的计算机视觉数据集，包含一系列手写数字图片和对应的标签。图片是28x28的像素矩阵，标签则对应着0~9的10个数字。每张图片都经过了大小归一化和居中处理。而MNIST数据库的文件格式是IDX格式，常见的计算机软件无法识别，参考《使用Python解析MNIST数据集（IDX文件格式）》，改编出一个程...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。