三层卷积神经网络
流程使用 Convolution - ReLU - Pooling -Affine - ReLU - Affine - Softmax
input层采用minst格式(只采用正则化参数),输入图像格式例如100,1,28,28
隐藏层[100,100,100]
输出层[26]
卷积使用5x5卷积核步数1
使用eMinst数据集
因为eminst数据集中by_class数据中存在大写字母,小写字母,数字混合数据,所有我使用了只包含大写字母的原始数据(未处理前128x128的图片),然后将这些数据批量处理变为minst标准格式的图片并生成gz包
图像处理我们下面介绍,gz具体生成流程
https://github.com/gskielian/JPG-PNG-to-MNIST-NN-Format
使用opencv-python处理图像数据
eminst官方论文有介绍他们对数据的具体处理流程,论文如下
https://arxiv.org/abs/1702.05373
首先所有初始的图片数据均为128x128的二值图像&#x