MNIST 数据集规则化
作为大三的我,前一段时间搞了手写数字识别,什么支持向量机啊,人工神经网络啊,knn啊,都玩过了,但仅仅是停留在人家公开的训练数据集上,而拿来测试用的图片也是人家的,比如mnist上的图片是这样的。
而我们拍的照片却是这样的
这样就带来了一个问题,测试的结果就不对了,用这样的图片去测试训练好的模型,可能有时候精度连10%都达不到。
这样,有必要将MNIST的生成过程学习一遍。
MNIST数据集
MNIST数据集是一个手写数字的集合,包含了60000个训练集和10000个测试集。每一个数字都是20x20的,包含在28x28的图片里面。这对于我们预处理是非常重要的。
预处理
#我们先预处理图片
i = 0
for no in [8,0,4,3]:
gray = cv2.imread("own_"+str(no)+".png", cv2.IMREAD_GRAYSCALE)
gray = cv2.resize(255-gray,(28,28))
cv2.imwrite("preprocessing/proImage_"+str(no)+".png",gray)
得到的图片是这样的: