Tensorflow的Hello World:MNIST 手写数字识别例子分析

朋友,沉下心来阅读你才会有收获,不要对长篇文字和代码感到畏惧,他们是你走向成功的伙伴

Tensorflow的Hello World:MNIST 手写数字识别例子分析

1.代码

首先给出MNIST数据集的tensorflow例程(python3.7 tensorflow有些API函数可能已经很旧):

import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("MNIST_data",one_hot=True)

batch_size=100
num_of_batches = mnist.train.num_examples // batch_size

x = tf.placeholder(tf.float32,[None,784])
y = tf.placeholder(tf.float32,[None,10])

#fully connected network,so 784*10 weights
W = tf.Variable(tf.zeros([784,10])) 
b = tf.Variable(tf.zeros([10]))
prediction = tf.nn.softmax(tf.matmul(x,W)+b)

#definition of cost function
loss = tf.reduce_mean(tf.square(prediction-y))
train_step = tf.train.GradientDescentOptimizer(0.2).minimize(loss)

#initialize variables 
init = tf.global_variables_initializer()

correct_prediction = tf.equal(tf.argmax(y,1),tf.arg_max(prediction,1))
accuracy = tf.reduce_mean(tf.cast(correct_prediction,tf.float32))

with tf.Session() as sess:
    sess.run(init)
    for epoch in range(21):
        for batch in range(num_of_batches):
            batch_xs,batch_ys = mnist.train.next_batch(batch_size)
            sess.run(train_step,feed_dict={x:batch_xs,y:batch_ys})

        acc = sess.run(accuracy,feed_dict={x:mnist.test.images,y:mnist.test.labels})
        print("Iter"+ str(epoch) + ",Testing Accuracy " + str(acc))

把代码分块来看,就不会一看到长篇代码就头疼了。像这份代码主要分为如下几个部分:
1.加载数据集
2.数据预处理
3.实现网络结构
4.训练并输出训练相关的信息

2.例程分析

在这个例子中,我们主要分析两个部分,一个是数据的预处理及数据格式部分,这一部分是模型实现时,普遍较难理解,也容易出错的点;另一个是网络的搭建以及训练的部分,主要学习其具体的代码的写法。

2.1数据格式部分

x = tf.placeholder(tf.float32,[None,784])
y = tf.placeholder(tf.float32,[None,10])

#fully connected network,so 784*10 weights
W = tf.Variable(tf.zeros([784,10])) 
b = tf.Variable(tf.zeros([10]))
prediction = tf.nn.softmax(tf.matmul(x,W)+b)

数据格式部分的代码如上,x是待输入的数据,y是待输入的对应标签,因为等待传入所以使用placeholder。

在这里指定x的shape为[None,784],y的shape为[None,10]指的是这两个张量的形状,第一个维度为对图片张数的索引,None代表可以是一张,也可以是n张图片.因为在这里x,y不仅要使用在批量输入数据上,还要用于传回测试集的样例和标签,所以使用了None的写法,是很方便的。原理上是可以定义成和batch一样的大小的。

W = tf.Variable(tf.zeros([784,10])) 
b = tf.Variable(tf.zeros([10]))
prediction = tf.nn.softmax(tf.matmul(x,W)+b)

这段代码中规定了权重W和偏置b个格式,可以看出这个网络只有两个层,一个输入层,一个输出层。但是由于是全连接层,所以有784x10个权重。由于输出层只有十个神经元,所以只需要1x10个偏置(详细理解,请学习神经元的具体结构,实在看不懂请画出神经网络的结构图)。

2.2神经网络搭建以及训练的具体细节。

从例子中可以看出,搭建及训练一个简单神经网络的大致的框架为:
1.加载数据集
2.搭建网络结构(包括激活函数,代价函数,所需运算变量的定义)
3.会话中训练(包括变量的初始化,在循环中训练,打印出精度信息)
可以看出,tensorflow和之前的keras相比还是要复杂一些的,但是是标准啊,学吧!

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值