理解手写数字图片Minst数据集的组成结构,即由测试集,验证集、训练集组成,可以说训练神经网络数据集的组成工作都是由这三部分组成的。
Minst数据集构成:
测试集:5000张图片,每张图片都是由784列数字组成。即在内存中表现的是5000行784列的张量数据。
验证集:10000张图片,10000行784列
训练集:50000张图片,50000行784列
读取数据集操作是由mnist = input_data.read_data_sets(“MNIST_data/”, one_hot=True)这行代码完成的,其实这行代码有两个意思,一个是把所有图片读入进内存,另外一个把图片对应的标签即这个图片是数字几按照one_hot编码的方式读进内存,这点在初识MNIST数据集的视频中没有讲明白,我是看了后续的视频才搞明白的。
Minst分类视频理解:
视频中主要讲解代码,但其实思路和线性回归是一致的。
1:准备数据就是mnist = input_data.read_data_sets(“MNIST_data/”, one_hot=True)这行代码。仔细想想这是tensorflow为我们准备好的数据,如果是自已要去准备这些数据,这个工作量应该不小。
2:搭建模型就是正向传播和反向传播的过程具体代码如下:
#搭建模型
x = tf.placeholder(tf.float32, [None, 784]) # mnist data维度 2828=784
y = tf.placeho