mnist手写数字识别_使用残差网络实现MNIST手写数字识别

最新推荐文章于 2022-11-02 13:39:28 发布

weixin_39837124

最新推荐文章于 2022-11-02 13:39:28 发布

阅读量260

点赞数

文章标签： mnist手写数字识别卷积神经网络mnist手写数字识别代码

在上一节的内容中我们已经介绍了残差网络的相关知识，并使用数学知识进行了原理解释，我们知道深度网络随着层数的增加，很容易造成“退化”和“梯度消失”的问题，训练数据的过拟合，ResNet中给出了一种解决方案：增加一个identity mapping，今天的内容主要是使用残差网络处理MNIST手写数字识别数据集。实现的流程主要如下所示：1导入相关模块2 定义Block类3 定义相关函数4 求解损失函数第一是先导入MNIST数据集，定义权重和偏置量：

在第二步中，我们根据输入和输出的尺寸是否相同，分为identity_block和conv_block，每种block都有如下两种模式：3卷积和2卷积形式，3卷积的速度的要更快一些。定义identity_block层的代码如下，下面是有3个卷积层，在输出的时候把输入值x_input和经过3层卷积层后输出的x相加，使用激活函数relu后输出得到result

下面是定义conv_block模块，由于该模块定义时输入和输出尺度不同，所以我们使用一个卷积层改变原来输入x_input的尺寸;再和3层卷积层操作后输出的x进行融合，通过一个激活函数relu，得到result

输入我们要使用的值x1，由x1经过一层卷积、池化等操作后成为残差网络的输入，在下面的代码中我们给出了3个x2，其中一个是使用convolutional_block函数求出的，另外两个是使用identity_block函数求出，一个为block b,一个为block c，大小都是14x14x246,经过reshape操作后大小变为7x7x256. 最后是一个全连接层，全连接层这里使用到了droupout函数

建立损失函数，使用交叉熵来计算：

初始化变量，每100次训练输出一次值出来;

最后是我们输出的结果：

可以看到准确率已经达到97.4%，我们训练次数越多，这个效果会更加好，下面我们把训练次数增加到20000次，结果显示准确率达到了98.2%

总结：本节用tensorflow实现了一个残差网络，通过代码可以发现，残差网络的设置并不难，只需要把经过卷积和池化操作后的输出值和输入值相加就得到了残差网络的输出。我们可以发现设置了残差网络后的效果也是很好的，训练20000次的准确率已经有98%了。读者如果有兴趣的话，可以多设置几个卷积层进行实验，看看最终的结果会如何，同时也可以利用我们前两节讲的保存模型方法来把我们训练后的model保存下来，以方便下次再使用。

关注小鲸融创，一起深度学习金融科技！

weixin_39837124

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫