MNIST初级入门解读

本文介绍了MNIST手写数字识别的初步入门,使用了TensorFlow和GradientDescentOptimizer进行训练。在实践中遇到问题,当训练数据接近尾声时,由于环境兼容性问题导致Python崩溃,即使减少训练数据量也无法解决。
摘要由CSDN通过智能技术生成
MNIST初级入门解读
https://www.tensorflow.org/get_started/mnist/beginners
http://yann.lecun.com/exdb/mnist/
http://www.jianshu.com/p/84f72791806f


机器学习的“Hello world!”程序就是MNIST。
MNIST是一个简单的计算机视觉数据图片集,手写的0-9。
MNIST数据集分为三部分:训练数据55000,测试数据10000,验证数据5000.(这一说法可能有点问题,参见:MNIST手写数字数据库简介)
图片标准:28x28=784象素。扁平化后后,形成784x1的向量。虽然丢失了二维结构的信息,但softmax回归也用不上。
把每张图片视为一个784个值的一维向量,55000张图片就是shape=[55000,784]的二维矩阵。
每个元素是一个0-1之间的灰度值。(0-255: 0,背景,白色; 255,前景,黑色)


标签:每张图有一个对应的标签,指出这张图写的是什么数字。代码设计中,一个数字用一个长度为10的向量表示,数字为几,就把对应下标的位置置1,下标从0开始。如数字3,写为 [0,0,0,1,0,0,0,0,0,0].这样,标签的shape=[55000,10]
本章的目的是学习softmax回归。
mnist_softmax.py的源码下载:https://www.github.com/tensorflow/tensorflow/blob/r1.2/tensorflow/examples/tutorials/mnist/mnist_softmax.py
如果不想下载,安装tensorflow后,可直接在IDE中导入【安装目录】\Lib\site-packages\tensorflow\examples\tutorials\mnist的python项目。


MNIST手写数字数据库简介
60000个训练数据,10000个测试数据。固定图片大小。不用再去预处理和格式化。但实际项目中,这一步少不了,而且比较繁琐。
运行程序后,后有四个包下载到本地目录:C:\tmp\tensorflow\mnist\input_data
t10k-images-idx3-ubyte.gz #测试数据图片10000张
t10k-labels-idx1-ubyte.gz #测试数据标签10000个
train-images-idx3-ubyte.gz #训练数据图片60000张
train-labels-idx1-ubyte.gz #训练数据标签60000个
在mnist.py中read_data_sets函数中,base.maybe_download给出的下载路径为:
SOURCE_URL = 'https://storage.googleapis.com/
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值