Tensorflow十个实践项目--手写数字识别

最新推荐文章于 2024-07-30 17:20:57 发布

ZhichaoDuan

最新推荐文章于 2024-07-30 17:20:57 发布

阅读量1.4k

点赞数 1

分类专栏：机器学习文章标签： tensorflow

本文链接：https://blog.csdn.net/ZhichaoDuan/article/details/80782478

版权

本文介绍了一个使用Tensorflow实现的手写数字识别项目，详细讲解了数据处理、模型构建以及网络结构。通过MNIST数据集，利用softmax回归和CNN进行分类，并探讨了模型优化、权重初始化和训练策略等关键点。

摘要由CSDN通过智能技术生成

可能很多萌新还是期待有一些详细的入门的小项目的教程，因此此次我们来介绍一个机器学习中最基本的项目，手写数字识别。

首先明确一下我们要做什么，听名字就知道，我们是要根据手写数字的图片，推断出所要表达的数字。

那么我们期待数字是什么样子的格式？

图片的话，自然而然就是一个 n*width*height*channels 的矩阵。标签可以是0,1,2等等一直到9。这些都没有任何问题。但是其实应对这种分类问题，我们可以将标签，通常也会将标签处理成one-hot形式。

那什么是one-hot？

实际上就是一种文本符号化的方式，比如这里我们有一张图片的标签是5. 那么符号化后的表示形式就是 0000010000。没错，对应位置是1，其余是0，这就是one-hot。

了解了这些之后，我们先来准备一下数据。因为这个项目实在是太具有教学意义了，所以Tensorflow已经给我们准备好了MNIST的有关数据并且给我们封装好了一些常用的操作。

# coding:utf-8
# 从tensorflow.examples.tutorials.mnist引入模块。这是TensorFlow为了教学MNIST而提前编制的程序
from tensorflow.examples.tutorials.mnist import input_data
# 从MNIST_data/中读取MNIST数据。这条语句在数据不存在时，会自动执行下载
mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)

# 查看训练数据的大小
print(mnist.train.images.shape)  # (55000, 784)
print(mnist.train.labels.shape)  # (55000, 10)

# 查看验证数据的大小
print(mnist.validation.images.shape)  # (5000, 784)
print(mnist.validation.labels.shape)  # (5000, 10)

# 查看测试数据的大小
print(mnist.test.images.shape)  # (10000, 784)
print(mnist.test.labels.shape)  # (10000, 10)

# 打印出第0幅图片的向量表示
print(mnist.train.images[0, :])

# 打印出第0幅图片的标签
print(mnist.train.labels[0, :])

可能有人会问，为什么有了测试集还需要验证集呢？

其实通常的做法是，在训练集上训练模型，然后通过模型在验证集上的表现调整参数，最后通过测试集确定模型的性能。

那为什么这里训练数据的大小是55000*784呢？

55000就是图片的数目，784是单个样本的大小，我们的手写数字识别的图片是28*28的灰度图，所以可以用1*784的向量来表示。

那我们应该怎么样还原这个向量得到一张完整的图片呢？其实我觉得这只是一个向量操作问题，代码如下：

#coding: utf-8
from tensorflow.examples.tutorials.mnist import input_data
import scipy.misc
import os

# 读取MNIST数据集。如果不存在会事先下载。
mnist = input_data.

最低0.47元/天解锁文章

ZhichaoDuan

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录