系列博客是博主学习神经网络中相关的笔记和一些个人理解,仅为作者记录笔记之用,不免有很多细节不对之处。代码见github
MNIST数据
MNIST 数据集作为入门数据集, 很多教程都有所介绍。我们这里利用的数据是从neural networks and deep learning教程获得到。我们将⽤按照该教程相同的数据分割方法,将60,000个图像的 MNIST 训练集分成两个部分:⼀部分包含50,000个图像的训练集(train_data),⽤来训练我们的神经⽹络,标签为1X10的向量(用argmax函数可以获得对应数字,matlab中需减去1),和⼀个单独的10,000个图像的验证集(validation_data),它的标签是一个标量数字。另外的10000个验证数据(test_data)暂时未使用。适合于Matlab使用的mat格式的数据可以在这里下载到(没有积分的朋友可私信我)。
试验
本节程序可以在这里下载到。
第三节实现的程序稍加修改就可以直接应用到MNIST手写字的识别上,隐层我们使用ReLU激活函数,输出层利用sigmoid函数。下面是网络结构为 [784 30 10],学习速率为2,子数据集大小为100时的训练结果:
我们可以看到在训练到5000次时,识别率达到95.96%。后面我们会反复对这个数据进行试验,进一步提高识别精度。下面是网络结构为 [784 30 30 10]的训练结果