【AI实战】训练第一个AI模型：MNIST手写数字识别模型

最新推荐文章于 2023-03-19 13:24:16 发布

imPlok

最新推荐文章于 2023-03-19 13:24:16 发布

阅读量349

点赞数

本文链接：https://blog.csdn.net/imPlok/article/details/93143845

版权

本文介绍了如何使用tensorflow训练MNIST手写数字识别模型，包括数据准备、预处理、模型构建、训练、评估和应用。通过实例详细讲解了AI建模的主要步骤，适合初学者入门。

摘要由CSDN通过智能技术生成

冲击年薪50W，助你进阶Python工程师>>>

在上篇文章中，我们已经把AI的基础环境搭建好了（见文章：Ubuntu + conda + tensorflow + GPU + pycharm搭建AI基础环境），接下来将基于tensorflow训练第一个AI模型：MNIST手写数字识别模型。
MNIST是一个经典的手写数字数据集，来自美国国家标准与技术研究所，由不同人手写的0至9的数字构成，由60000个训练样本集和10000个测试样本集构成，每个样本的尺寸为28x28，以二进制格式存储，如下图所示：

MNIST手写数字识别模型的主要任务是：输入一张手写数字的图像，然后识别图像中手写的是哪个数字。

该模型的目标明确、任务简单，数据集规范、统一，数据量大小适中，在普通的PC电脑上都能训练和识别，堪称是深度学习领域的“Hello World!”，学习AI的入门必备模型。

0、AI建模主要步骤
在构建AI模型时，一般有以下主要步骤：准备数据、数据预处理、划分数据集、配置模型、训练模型、评估优化、模型应用，如下图所示：

下面将按照主要步骤进行介绍。
【注意】由于MNIST数据集太经典了，很多深度学习书籍在介绍该入门模型案例时，基本上就是直接下载获取数据，然后就进行模型训练，最后得出一个准确率出来。但这样的入门案例学习后，当要拿自己的数据来训练模型，却往往不知该如何处理数据、如何训练、如何应用。在本文，将分两种情况进行介绍：（1）使用MNIST数据（本案例），（2）使用自己的数据。

下面将针对模型训练的各个主要环节进行介绍，便于读者快速迁移去训练自己的数据模型。

1、准确数据
准备数据是训练模型的第一步，基础数据可以是网上公开的数据集，也可以是自己的数据集。视觉、语音、语言等各种类型的数据在网上都能找到相应的数据集。
（1）使用MNIST数据（本案例）
MNIST数据集由于非常经典，已集成在tensorflow里面，可以直接加载使用，也可以从MNIST的官网上（http://yann.lecun.com/exdb/mnist/）直接下载数据集，代码如下：

from tensorflow.examples.tutorials.mnist import input_data

# 数据集路径
data_dir='/home/roger/data/work/tensorflow/data/mnist'

# 自动下载 MNIST 数据集
mnist = input_data.read_data_sets(data_dir, one_hot=True)

# 如果自动下载失败，则手工从官网上下载 MNIST 数据集，然后进行加载
# 下载地址  http://yann.lecun.com/exdb/mnist/
#mnist=input_data.read_data_sets(data_dir,one_hot=True)

集成或下载的MNIST数据集已经是打好标签了，直接使用就行。

（2）使用自己的数据
如果是使用自己的数据集，在准备数据时的重要工作是“标注数据”，也就是对数据进行打标签，主要的标注方式有：
① 整个文件打标签。例如MNIST数据集，每个图像只有1个数字，可以从0至9建10个文件夹，里面放相应数字的图像；也可以定义一个规则对图像进行命名，如按标签+序号命名；还可以在数据库里面创建一张对应表，存储文件名与标签之间的关联关系。如下图：

② 圈定区域打标签。例如ImageNet的物体识别数据集，由于每张图片上有各种物体，这些物体位于不同位置，因此需要圈定某个区域进行标注，目前比较流行的是VOC2007、VOC2012数据格式，这是使用xml文件保存图片中某个物体的名称（name）和位置信息（xmin,ymin,xmax,ymax）。
如果图片很多，