前言
MNIST是一个入门级的计算机视觉数据集,是NIST的一个子集,常被用于机器学习的入门实践。
它包含各种手写数字图片,同时也包含每一张图片对应的标签,告诉我们这个是数字几。比如,上面这四张图片的标签分别是5,0,4,1
本文目标是练习tensorflow使用方法,巩固概念。
从较为简单的softmax regression模型入手,熟悉后再尝试更复杂的模型。
主要参考tensorflow的教程 www.tensorfly.cn
MNIST数据集下载
常见的代码是如下
import tensorflow.examples.tutorials.mnist.input_data as input_data
mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)
但国内由于网络限制,经常出现无法成功下载的情况。
手动下载:Yann LeCun’s website官网
下载后,不要解压,直接将4个文件放在你的py文件同目录下的MNIST_data文件夹下。
训练集:60000个训练样本
测试集:10000个测试样本
数字已经规格化,并位于固定大小图像的中心,每一张图片包含28X28个像素点。
分为images图像,和labels标签