由于昨天看了TensorFlow的基础模型,遇到了mnist数据库的问题,今天先阅读材料,学习一下。
1.MNIST数据库是一个手写数字的数据库,它提供了六万的训练集和一万的测试集
2.它的图片是被规范处理过的,是一张被放在中间部位的28px*28px(28*28个像素点)的灰度图
3.每张图片都带有一个标签,例如这张图片是1,他的标签就是1,标签不是用数字表示,而是用标签表示,例如1表示成[0,1,0,0,0,0,0,0,0,0],; 0表示成[1,0,0,0,0,0,0,0,0,0], 9应该表示成[0,0,0,0,0,0,0,0,0,1],了吧
4、读取mnist数据后,如何识别图片呢?首先将图片转换为28×28且文字居中的灰度图(白色0,黑色1)
然后将将28*28的矩阵转换成1维矩阵(也就是把第2,3,4,5....行矩阵纷纷接入到第一行的后面);
用一个1*10的向量代表标签,也就是这个数字到底是几,举个例子数字1对应的矩阵就是[0,1,0,0,0,0,0,0,0,0]
最后就开始通过softmax回归预测图片是哪个数字的概率
5.输入
6.预期输出:
mnist自身带有函数next_batch,返回值就是下一批的数据与标签,如果使用自定义数据集,可能需要重新写该类以及里面的函数,而不是直接按照其格式修改占位符那么简单