学习笔记(五)Tensorflow实现Soft Regression简单识别MNIST手写数字

本文记录了使用Tensorflow进行MNIST手写数字识别的过程,通过Soft Regression算法实现简单识别,平均准确率为91.99%。文章介绍了数据加载、常见错误及解决方法,展示了训练数据的结构,并探讨了Soft Regression的工作原理。
摘要由CSDN通过智能技术生成

MNIST数据库官网
推荐阅读Tensorflow官方文档中文版 MNIST机器学习入门
以及黄文坚、唐源编著的《TensorFlow实战》

注:本文非标准教程,仅是总结个人学习过程,可能存在纰漏,如有错误之处欢迎留言告知,非常感谢

一、加载MNIST数据
在这之前需要先安装IPYTHON以便能在terminal中编写python代码

sudo apt-get install ipython-notebook

虽然直接输入python命令也可以编写python代码,但ipython的优点是提供了代码自动补全,自动缩进,高亮显示等功能。
打开terminal输入

ipython

这里写图片描述
输入以下代码:

from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("./MNIST_data/", one_hot=True)  #在MNIST_data目录中加载MNIST数据集

import tensorflow as tf
sess = tf.InteractiveSession()
x = tf.placeholder(tf.float32, [None, 784])

W = tf.Variable(tf.zeros([784,10]))
b = tf.Variable(tf.zeros([10]))

y = tf.nn.softmax(tf.matmul(x,W) + b)

y_ = tf.placeholder(tf.float32, [None,10])
cross_entropy = tf.reduce_mean(-tf.reduce_sum(y_ * tf.log(y),reduction_indices=[1]))

train_step = tf.train.GradientDescentOptimizer(0.5).minimize(cross_entropy)

tf.global_variables_initializer().run()   #执行

for i in range(1000):
    batch_xs,batch_ys = mnist.train.next_batch(100)
    train_step.run({x:batch_xs,y_:batch_ys})
    correct_prediction = tf.equal(tf.argmax(y,1),tf.argmax(y_,1))

accuracy = tf.reduce_mean(tf.cast(correct_prediction,tf.float32))

print(accuracy.eval({x:mnist.test.images,y_:mnist.test.labels}))   #打印准确率

每行代码的含义在《TensorFlow实战》中有详细介绍
极客学院中TensorFlow官方文档中文版 MNIST机器学习入门也有介绍

如下图是运行成功后的截图:
这里写图片描述
如图最后一行可以看到训练的结果的平均准确率为91.99%
以上例子仅是使用tensorflow实现了一个简单的机器学习算法Soft Regressin,结果是较为不精确的,这可以算作是一个没有隐含层的最浅的神经网络。
整个流程我们做的事情有4个部分:

(1)定义算法公式
(2)定义loss,选定优化器
(3)迭代地对数据进行训练
(4)在测试集或验证集上对准确率进行评测

这几个步骤是我们使用TensorFlow进行算法设计、训练的核心步骤,也贯穿其他类型神经网络。接下来我将继续学习其他算法提高准确率

二、可能出现的错误
1.

version `CXXABI_1.3.8' not found

这里写图片描述
解决方法:

conda update libgcc
cd ~/anaconda3/lib
mv libstdc++.so libstdc++.so.bkp
mv libstdc++.so.6 libstdc++.so.6.bkp
进一步(可选)在anoconda库中创建一个软链接 ln -s /usr/lib/x86_64-linux-gnu/libstdc++.so.6 libstdc++.so.6

解决方法参考网址:https://stackoverflow.com/questions/39844772/cxxabi-1-3-8-not-found-in-tensorflow-gpu-install-from-source

2.

name 'input_data' is not defined

这里写图片描述
那么由这两行代码

from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("./MNIST_data/", one_hot=True)

替代

import tensorflow.examples.tutorials.mnist.input_data
mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)

这两行代码的作用是在MNIST_data目录中加载生成这四个小可爱
其实就是MNIST的训练集和测试集
这里写图片描述
这里写图片描述
3.报错

urlopen error [Errno 101] Network is unreachable

大概是网络不稳,重新再来一次就行了

三、查看MNIST数据集的情况

print(mnist.train.images.shape,mnist.train.labels.shape)
print(mnist.test.images.shape,mnist.test.labels.shape)
print(mnist.validation.images.shape,mnist.validation.labels.shape)

这里写图片描述
可以看到训练集有55000个样本,测试集有10000个样本,验证集有5000个样本
每个样本都有它对应的标注信息,就是label

训练数据是55000×784的Tensor:
这里写图片描述
训练数据label是一个55000×10的Tensor:
这里写图片描述
只有一个值为1,其余为0,label是一个十维向量。
如图,0为[1,0,0,0,0,0,0,0,0,0,0]
1为[0,1,0,0,0,0,0,0,0,0,0]以此类推,数字n就表示为对应位置的值为1。

四、Soft Regression算法
以上代码使用了Soft Regression算法,这个算法是训练手写数字识别的分类模型。
数字0~9一共有10个类别,Soft Regression对每一个类别估算概率,比如当模型对数字3的图片进行预测时,假设预测是数字3的概率为80%,预测是数字5的概率是5%,最后取概率最大的那个为模型的输出结果。
这里写图片描述
如图,明亮区域代表负的权重,灰暗区域代表真正的权重。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值