相信很多读者在刚刚入门深度学习时都会运行一下MNIST数据集,MNIST数据集链接地址为:http://yann.lecun.com/exdb/mnist/。MNIST是一个手写数字的数据集,该数据集中包括训练集和测试集两部分,训练集包含了60000个样本,测试集包含了10000个样本,图4-1显示了MNIST数据集的图像样例,本章讲介绍如何使用MXNet框架实现MNIST手写数字体的分类。
计算机对图像的认知并没有人类对图像的认知那么直观,那么计算机看到的图像到底是什么样的呢?其实图像数据对于计算机而言都只是一些像素点构成的矩阵,比如图4-1所示的数字图像对于计算机而言只是一个二维矩阵,这个二维矩阵如图4-2所示。
这个矩阵的维度是(28,28,1),前面两个维度就是我们直观上看到的图像尺寸,最后的一个维度表示通道数,由于MNIST数据集都是灰度图像,所以通道数都是1,如果是彩色图像,那么对于常见的RGB形式图像而言,通道数就是3,这3个通道分别表示R(red)、G(green)、B(blue)
。因此图像对于计算机而言就是一个三维矩阵,对于灰度图而言,由于第三维是1,所以可以简化成一个二维矩阵&
【MXNet学习21】 4 MNIST手写数字体分类
最新推荐文章于 2023-10-12 13:17:30 发布