python机器学习手写字体识别_tensorflow-gpu版实现简单MNIST手写字识别1

最新推荐文章于 2022-06-09 17:45:04 发布

weixin_39793794

最新推荐文章于 2022-06-09 17:45:04 发布

阅读量335

点赞数

文章标签： python机器学习手写字体识别

-- 环境：win10, jupyter notebook/pycharm, python3.x, tensorflow1.3.0-gpu

环境搭建看上一章

首先手写字图片加载

Tensorflow为我们提供了一个方便的封装，可以直接加载MNIST数据成我们期望的格式，代码如下：

from tensorflow.examples.tutorials.mnist import input_data

mnist = input_data.read_data_sets("MNIST_data/",one_hot = True)

这样加载的mnist数据集中，可以得到训练集有55000个样本，测试集有10000个样本，同时验证集有5000个样本，每个样本都有对应的[0, 0 ,0, 0 ,0 ,0 ,0 ,0 ,0 0 ]10维的向量label,这里是对10个种类进行了one-hot编码。

手写字母灰度信息

MNIST训练集数据label

这里数据准备好了，接下来就是设计算法。

Softmax Regression算法模型

我们的数字都是0-9之间的，所以一共有10个类别，当我们的模型对一张图片预测时，Softmax Regression会对每一种类别估算一个概率：比如预测数字3的概率为80%，是数字5的概率为5%，最后取概率最大的数字作为模型的输出结果。

特征公式：

特征公式

i代表第i类，j代表一张图片的第j个像素，bi是bias,顾名思义就是这个数据本身的一些倾向

对所有特征计算softmax

softmax(x)

简单说就是计算一个exp函数，然后再进行标准化(让所有类别输出的概率值和为1)

判定为第i类的概率可由下面的公式得到

softmax(x)i

softmax regression流程

softmax Regression元素乘法示例

softmax Regression矩阵乘法示例

其实简洁的公式可以有下面这个表达：

使用tensorflow实现Softmax Ragression

首先导入TensorFlow库，并创建一个新InteractiveSession,使用这条命令会将这个Session注册为默认的session,之后的运算也默认跑在这session里，不同的session之间的数据运算应该都是相互独立的，接下来，就是创建一个Placeeholder,即输入数据的地方，Placeholder的第一个参数是数据的类型，第二个参数[None, 784]代表tensor的shape,也就是数据的尺寸，这里None代表不限条数的输入，784代表每条输入是一个784维的向量。

import tensorflow as tf

sess = tf.InteractiveSession()

x = tf.placeholder(tf.float32, [None, 784])

接下来要给Softmax Regression模型中的weights和biases创建Variable对象,Variable是用来存储模型参数的，不同于存储数据对的tensor一旦使用掉就会消失， Variable在模型训练中被更新。将weight和biases全部初始化为0因为模型训练时会自动学习合适、的值，所以对这个简单模型来说初始化值不太重要。不过对复杂的卷积网络，循环网络或者比较深的全连接网络，初始化的方法就比较重要，甚至可以说至关重要，注意这里W的shape是 [784, 10],784是特征的维数，而10代表有10类，因为Lable在one-hot编码后是10维的向量。

W = tf.Variable(tf.zeros([784, 10]))

b = tf.Variable(tf.zeros([10]))

接下来就是实现Softmax Regression 算法，公式

y = tf.nn.softmax(tf.matmul(x, W) + b)

#softmaax是tf.nn下面的一个函数，而tf.nn则包含了大量神经网络的组件，tf.matmul

#是Tensorflow中的矩阵乘法函数

loss function

为了训练模型，我们需要定义一个loss funcation来描述对问题的分类精度。

很多问题通常使用Cross-entropy作为loss-funcation,tensorflow中定义Cross-entropy,通常可用它来判断模型对真实概率分布估计的准确程度。

Cross-entropy

#在tensorflow中定义Cross-entropy

y_ = tf.placeholder(tf.float32, [None, 10])

cross_entropy = tf.reduce_mean(-tf.reduce_sum(y_ * tf.log(y), reduction_indices = [1]))

优化器

train_step = tf.train.GradientDescentOptimizer(0.5).minimize(cross_entropy)

下一步使用Tensorflow的全局参数初始化器tf.global_variables_initializer,

#并直接执行它的run方法

tf.global_variables_initializer().run()

最后一步

开始迭代地执行训练操作train_step.这里每次随机从训练中取出100条样本构成一个mini-batch,并feed给placeholder,然后调用train_stepd对这些样本进行训练，使用一小部分样本进行训练称为随机梯度下降与每次使用全部样本的传统的梯度下降对应，如果每次训练使用全部样本，计算量太大有时也不容易挑出局部最优。因此，对于大部分机器学习问题，我们都只使用一小部分数据进行随机梯度下降，这种做法绝大多数数时候会比全部样本训练的收敛速度快很多。

for i in range(100000):

batch_xs, batch_ys = mnist1.train.next_batch(1000)

train_step.run({x:batch_xs, y_:batch_ys})

现在训练已经完成了，接下来就可以对模型的准确率进行验证。下面代码中的tf.argmax是从一个tensor中寻找最大值的序号，tf.argmax(y,1)就是求各个预测的数字中概率最大的那个，而tf.argmax(y_,1)则是找样本的真实数字类别。而tf.equal方法则用来判断预测的数字类别是否是正确的类别，最后返回计算分类是否正确的操作correct_predition。

correct_prediction = tf.equal(tf.argmax(y,1), tf.argmax(y_,1))

accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

print(accuracy.eval({x:mnist1.test.images, y_: mnist1.test.labels}))

准确率

weixin_39793794

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python机器学习手写字体识别_tensorflow-gpu版实现简单MNIST手写字识别1

-- 环境：win10, jupyter notebook/pycharm, python3.x, tensorflow1.3.0-gpu环境搭建看上一章首先手写字图片加载Tensorflow为我们提供了一个方便的封装，可以直接加载MNIST数据成我们期望的格式，代码如下：from tensorflow.examples.tutorials.mnist import input_datamni...
复制链接

扫一扫