下载下来的数据被分为两部分:60000行的训练数据集(mnist.train)和10000行的测试数据集(mnist.test)
MNIST handwritten digit database, Yann LeCun, Corinna Cortes and Chris Burges
MNIST的数据
一张图片包含28*28个像素,我们把这一个数组展开成一个向量,长度是28*28=784.如果把数据用矩阵表示,可以把MNIST训练数据变成一个形状为[60000,784]的矩阵,第一个维度数字用来索引图片,第二个维度数字用来索引每张图片中的像素点。图片里的某个像素的强度值介于0-1之间
独热编码(one-hot)
MNIST数据集的标签是介于0-9的数字,我们要把标签转化为“one-hot Vectors"。一个one-hot向量除了某一位数字是1以外,其余维度数字都是0,比如标签0将表示为([1,0,0,0,0,0,0,0,0,0]),标签3将表示为([0,0,0,1,0,0,0,0,0,0]).
因此,可以把MNIST训练集的标签变为[60000,10]的矩阵