目录
引言——MINIST是什么?
现如今诸如车牌识别,验证码识别,身份证识别等应用在我们的日常生活中被使用的越来越广泛。为此有专门学者收集了基本数字从0-9不同写法的书写方式,形成一个专门的数据集,这便是MINIST手写数据集的由来。
MINIST手写数据集(官方网站)中,每个数字包含7000张图片,共70k张。每张图片的格式为28*28。训练模型时通常将数据集划分为60k张训练集和10k张测试集。
基本构造
每张输入图片为28*28格式(共784个像素点),用矩阵表示为[28,28],分别表示行列长度。每个像素点数值范围为0-1,0表示白色 1表示黑色(或相反)。
把每张图片平铺成[784]格式,再加