tensorflow实现手写数字识别

从torch入门的我,很排斥tensorflow, 不过最近不得不学了,不然我刚找的工作怕是要换人了。

ok,那让我们愉快的学习吧。

我们先来一个AI届的Hello World !! . 手写数字识别。然后遇到其中的问题我们再来一一解释,毕竟最快的学习方式还是项目!

这个系列是这样计划的,完成手写体识别后就直接开始尝试复现我找工作的领域中的经典推荐算法模型了。复现完成后再重新补足理论。

由于工业界对于tensorflow 1 系列的依赖太强,我们选用tensorflow 1.13.1 版本来进行。

1. 环境准备

  • tensorflow=1.13.1

2. 数据准备

from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("MNIST_data",one_hot=True)

我们看一下这个 数据规模,以train为例:

mnist.train.images.shape

得到的结果为:

(55000, 784)

这个784实际上为24*24,就是每个图片的784个像素现在被拉成一行了。我们随便取一个数据,将其拉伸回 24 × 24 24\times24 24×24,就可以看到整个图片了。

import pylab
im = mnist.train.images[1]
im = im.reshape(-1,28)
pylab.imshow(im)
pylab.show()

在这里插入图片描述

既然数据如此小,我们先来试试线性回归吧。

3. 构建模型和初始化参数

线性模型没啥好说的:

y = X W T + b y = \bold{X}\bold{W^T} + b y=XWT+b

其中的参数只有 W \bold{W} W b b b。对于静态图为依托的tensorflow 1.x来说,我们需要先构建完成整个模型的传输体系,然后将其放在sess中,才能真正的开始运行。

现在我们先来构建模型和参数。

对于数据来说,我们需要先指定其尺寸,但是并没有真正的数据,在运行的时候再喂进去才行。指定尺寸的方式就是用占位符:


tf.reset_default_graph()   # reconstruct the static graph
x = tf.placeholder(tf.float32,[None,784])
y = tf.placeholder(tf.float32,[None,10])
x.shape,y.shape

对于初始化参数来说,这个模型中的参数无非就是包含W和b,对于卷积来说,其参数无非就是卷积核和偏置。那个在后续中会讲解。

W = tf.Variable(tf.random_normal(([784,10])))
b = tf.Variable(tf.zeros([10]))
W,b

输出


pred = tf.nn.softmax(tf.matmul(x,W)+b)

3. 定义训练过程


cost = tf.reduce_mean(-tf.reduce_sum(y*tf.log(pred),reduction_indices=1))
learning_rate = 0.01
optimizer = tf.train.GradientDescentOptimizer(learning_rate).minimize(cost)

training_epochs = 25
batch_size = 100
display_step = 1


with tf.Session() as sess:
  sess.run(tf.global_variables_initializer())  # Init op

  for epoch in range(training_epochs):
    avg_cost = 0
    total_batch = int(mnist.train.num_examples/batch_size)
    for i in range(total_batch):
      batch_xs,batch_ys = mnist.train.next_batch(batch_size)
      _, c = sess.run([optimizer,cost],feed_dict={x:batch_xs,y:batch_ys})
      avg_cost += c/total_batch
    if (epoch + 1)%display_step == 0:
      print(f"Epoch:{epoch+1},cost={avg_cost:.9f}")
  print("fnished")

  correct_prediction = tf.equal(tf.argmax(pred,1),tf.argmax(y,1))
  accuracy = tf.reduce_mean(tf.cast(correct_prediction,tf.float32))
  print("Accuracy:",accuracy.eval({x:mnist.test.images,y:mnist.test.labels}))


我们分析一下,其与torch的不同之处,

  1. tensor训练时必须要在sess之内,否则不会真实运行
  2. tensor取数据的时候是x.next_batch(batch_size)
  3. sess.run([优化器,损失函数],feed_dict={数据字典}) --> _,cost
  4. 评估方式,method = tf.xx(), method.eval({数据字典})

ok,最后的运行结果是这样的。

Epoch:1,cost=7.546023723
Epoch:2,cost=4.171652060
Epoch:3,cost=2.972595831
Epoch:4,cost=2.377042001
Epoch:5,cost=2.016216151
Epoch:6,cost=1.779922282
Epoch:7,cost=1.617819570
Epoch:8,cost=1.489061758
Epoch:9,cost=1.393508704
Epoch:10,cost=1.312454587
Epoch:11,cost=1.255874819
Epoch:12,cost=1.191187488
Epoch:13,cost=1.152227032
Epoch:14,cost=1.099380152
Epoch:15,cost=1.076827528
Epoch:16,cost=1.038087001
Epoch:17,cost=1.014115727
Epoch:18,cost=0.983060481
Epoch:19,cost=0.969432110
Epoch:20,cost=0.936379928
Epoch:21,cost=0.926966454
Epoch:22,cost=0.899857285
Epoch:23,cost=0.897358320
Epoch:24,cost=0.867424971
Epoch:25,cost=0.862724741
fnished
Accuracy: 0.8281
  • 1
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

古承风

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值