在上一个博客中,我们已经对MNIST数据集的数据格式有了一定的了解,这里我们要完成的工作是将读到的数据转成图片,存入文件夹中,以便日后使用。在开始之前,我们先对该数据库的存储格式进行一个具体的介绍:
MNIST(Mixed National Institute of Standards and Technology database)是一个计算机视觉数据集,它包含70000张手写数字的灰度图片,包括60000张训练图片(60000训练集分拆为 55000 的训练集和 5000 的验证集)和10000张测试图片,其中每一张图片包含 28 X 28 个像素点。官网给的数据集合并不是原始的图像数据格式,而是编码后的二进制格式:
图像的编码为:
典型的head+data模式:前16个字节分为4个整型数据,每个占据4字节,分别代表:数据信息des、图像数量(img_num),图像行数(row)、图像列数(col),之后的数据全部为像素,每row*col个像素构成一张图,每个色素的值为(0-255)。即测试图像(rain-images-idx3-ubyte)与训练图像(train-images-idx3-ubyte)由5部分组成