来源说明
MNIST官方网站,http://yann.lecun.com/exdb/mnist/。我只是做了一个搬运工。
MNIST文件说明
MNIST一共包含了四个文件,这四个文件的定义如下表:
文件名 | 作用 | |
t10k-images-idx3-ubyte | 测试集图片 | test set images |
t10k-labels-idx1-ubyte | 测试集标签 | test set labels |
train-images-idx3-ubyte | 训练集图片 | training set images |
train-labels-idx1-ubyte | 训练集标签 | training set labels |
MNIST图片概述
训练集包括 60,000 个例子,测试集包括 10,000 个例子。测试集前面 5,000 个例子来自 NIST 训练集。测试集前面 5,000 个例子比后面 5,000 个例子更加简单和干净。
训练集标签文件
偏移量 | 数据类型 | 数值 | 描述 |
0000 | 32b整数 | 0x0000801(2049) | magic number (MSB first) |
0004 | 32b整数 | 6000 | number of items |
0008 | unsigned byte | ?? | label |
0009 | unsigned byte | ?? | label |
xxxx | unsigned byte | ?? | label |
标签(label)取值范围为:0 ~ 9。
训练集图片文件
偏移量 | 数据类型 | 数值 | 描述 |
0000 | 32b整数 | 0x0000803(2051) | magic number |
0004 | 32b整数 | 6000 | number of images |
0008 | 32b整数 | 28 | number of rows |
0012 | 32b整数 | 28 | number of columns |
0016 | unsigned byte | ?? | pixel |
0017 | unsigned byte | ?? | pixel |
xxxx | unsigned byte | ?? | pixel |
像素由智能行组成。像素的取值范围为 0 ~ 255,0 意味着背景(白色),255意味着前景(黑色)。
Pixels are organized row-wise. Pixel values are 0 to 255. 0 means background (white), 255 means foreground (black).
测试标签文件
偏移量 | 数据类型 | 数值 | 描述 |
0000 | 32b整数 | 0x0000801(2049) | magic number (MSB first) |
0004 | 32b整数 | 10000 | number of items |
0008 | unsigned byte | ?? | label |
0009 | unsigned byte | ?? | label |
xxxx | unsigned byte | ?? | label |
标签(label)取值范围为:0 ~ 9。
测试集图片文件
偏移量 | 数据类型 | 数值 | 描述 |
0000 | 32b整数 | 0x0000803(2051) | magic number |
0004 | 32b整数 | 10000 | number of images |
0008 | 32b整数 | 28 | number of rows |
0012 | 32b整数 | 28 | number of columns |
0016 | unsigned byte | ?? | pixel |
0017 | unsigned byte | ?? | pixel |
xxxx | unsigned byte | ?? | pixel |
像素由智能行组成。像素的取值范围为 0 ~ 255,0 意味着背景(白色),255意味着前景(黑色)。
Pixels are organized row-wise. Pixel values are 0 to 255. 0 means background (white), 255 means foreground (black).