目录
2.1、卷积神经网络简介( convolutional neural network 简称CNN)
一、MNIST数据集介绍
MNIST是一个非常有名的手写体数字识别数据集。很多的深度学习都是采用
数据集下载地址:http://yann.lecun.com/exdb/mnist/
下载后用下面的代码导入到你的项目里面,也可以直接复制粘贴到你的代码文件里面。
import input_data
mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)
下载下来的数据集被分成两部分:60000行的训练数据集(mnist.train
)和10000行的测试数据集(mnist.test
)。这样的切分很重要,在机器学习模型设计时必须有一个单独的测试数据集不用于训练而是用来评估这个模型的性能,从而更加容易把设计的模型推广到其他数据集上(泛化)。
这个数据集由四部分组成,分别是:
也就是一个训练图片集,一个训练标签集,一个测试图片集,一个测试标签集;我们可以看出这个其实并不是普通的文本文件或是图片文件,而是一个压缩文件,下载并解压出来,我们看到的是二进制文件,其中训练图片集的内容部分如此。
在MNIST图片集中,所有的图片都是28×28的,也就是每个图片都有28×28个像素;
下面是MNIST的一些数据:
0的数据集示例:
1的数据集示例:
2的数据集示例:
3的数据集示例:
4的数据集示例:
5的数据集示例: