一、手写数字识别简介
手写数字识别是一个非常经典的图像分类任务,经常被作为深度学习入门的第一个指导案例。相当于我们学编程语言时,编写的第一个程序“Hello World !”。不一样的是,入门深度学习,需要有一定量的理论基础。
手写数字识别是基于MNIST数据集的一个图像分类任务,目的是通过搭建深度神经网络,实现对手写数字的识别。
二、MNIST数据集介绍
为了方便业界统一测试和评估算法, 1998 年 Lecun 等人发布了手写数字图片数据集,并将其命名为 MNIST,它包含了 0~9 共 10 种数字的手写图片,每种数字一共有 7000 张图片,采集自不同书写风格的真实手写图片,一共 70000 张图片。其中 60000 张图片作为训练集,用来训练模型。10000 张图片作为测试集,用来训练或者预测。训练集和测试集共同组成了整个 MNIST 数据集。
MINIST 数据集中的每张图片,大小为 28 × \times × 28,同时只保留灰度信息(即单通道)。下图是 MNIST 数据集中的部分图片: