MNIST初级入门解读
https://www.tensorflow.org/get_started/mnist/beginners
http://yann.lecun.com/exdb/mnist/
http://www.jianshu.com/p/84f72791806f
机器学习的“Hello world!”程序就是MNIST。
MNIST是一个简单的计算机视觉数据图片集,手写的0-9。
MNIST数据集分为三部分:训练数据55000,测试数据10000,验证数据5000.(这一说法可能有点问题,参见:MNIST手写数字数据库简介)
图片标准:28x28=784象素。扁平化后后,形成784x1的向量。虽然丢失了二维结构的信息,但softmax回归也用不上。
把每张图片视为一个784个值的一维向量,55000张图片就是shape=[55000,784]的二维矩阵。
每个元素是一个0-1之间的灰度值。(0-255: 0,背景,白色; 255,前景,黑色)
标签:每张图有一个对应的标签,指出这张图写的是什么数字。代码设计中,一个数字用一个长度为10的向量表示,数字为几,就把对应下标的位置置1,下标从0开始。如数字3,写为 [0,0,0,1,0,0,0,0,0,0].这样,标签的shape=[55000,10]
本章的目的是学习softmax回归。
mnist_softmax.py的源码下载:https://www.github.com/tensorflow/tensorflow/blob/r1.2/tensorflow/examples/tutorials/mnist/mnist_softmax.py
如果不想下载,安装tensorflow后,可直接在IDE中导入【安装目录】\Lib\site-packages\tensorflow\examples\tutorials\mnist的python项目。
MNIST手写数字数据库简介
60000个训练数据,10000个测试数据。固定图片大小。不用再去预处理和格式化。但实际项目中,这一步少不了,而且比较繁琐。
运行程序后,后有四个包下载到本地目录:C:\tmp\tensorflow\mnist\input_data
t10k-images-idx3-ubyte.gz #测试数据图片10000张
t10k-labels-idx1-ubyte.gz #测试数据标签10000个
train-images-idx3-ubyte.gz #训练数据图片60000张
train-labels-idx1-ubyte.gz #训练数据标签60000个
在mnist.py中read_data_sets函数中,base.maybe_download给出的下载路径为:
SOURCE_URL = 'https://storage.googleapis.com/
https://www.tensorflow.org/get_started/mnist/beginners
http://yann.lecun.com/exdb/mnist/
http://www.jianshu.com/p/84f72791806f
机器学习的“Hello world!”程序就是MNIST。
MNIST是一个简单的计算机视觉数据图片集,手写的0-9。
MNIST数据集分为三部分:训练数据55000,测试数据10000,验证数据5000.(这一说法可能有点问题,参见:MNIST手写数字数据库简介)
图片标准:28x28=784象素。扁平化后后,形成784x1的向量。虽然丢失了二维结构的信息,但softmax回归也用不上。
把每张图片视为一个784个值的一维向量,55000张图片就是shape=[55000,784]的二维矩阵。
每个元素是一个0-1之间的灰度值。(0-255: 0,背景,白色; 255,前景,黑色)
标签:每张图有一个对应的标签,指出这张图写的是什么数字。代码设计中,一个数字用一个长度为10的向量表示,数字为几,就把对应下标的位置置1,下标从0开始。如数字3,写为 [0,0,0,1,0,0,0,0,0,0].这样,标签的shape=[55000,10]
本章的目的是学习softmax回归。
mnist_softmax.py的源码下载:https://www.github.com/tensorflow/tensorflow/blob/r1.2/tensorflow/examples/tutorials/mnist/mnist_softmax.py
如果不想下载,安装tensorflow后,可直接在IDE中导入【安装目录】\Lib\site-packages\tensorflow\examples\tutorials\mnist的python项目。
MNIST手写数字数据库简介
60000个训练数据,10000个测试数据。固定图片大小。不用再去预处理和格式化。但实际项目中,这一步少不了,而且比较繁琐。
运行程序后,后有四个包下载到本地目录:C:\tmp\tensorflow\mnist\input_data
t10k-images-idx3-ubyte.gz #测试数据图片10000张
t10k-labels-idx1-ubyte.gz #测试数据标签10000个
train-images-idx3-ubyte.gz #训练数据图片60000张
train-labels-idx1-ubyte.gz #训练数据标签60000个
在mnist.py中read_data_sets函数中,base.maybe_download给出的下载路径为:
SOURCE_URL = 'https://storage.googleapis.com/