走进tensorflow第四步——使用残差网络实现MNIST手写数字识别

最新推荐文章于 2022-06-20 18:18:20 发布

beyond_LH

最新推荐文章于 2022-06-20 18:18:20 发布

阅读量5.6k

点赞数 6

分类专栏： AI 文章标签： Resnet tensorflow sse mnist

本文链接：https://blog.csdn.net/beyond9305/article/details/88624679

版权

AI 专栏收录该内容

26 篇文章 263 订阅 ¥9.90 ¥99.00

订阅专栏

本文介绍了在TensorFlow中使用残差网络(ResNet)实现MNIST手写数字识别时遇到的问题和解决方案。作者发现原代码中残差模块的输出层存在不必要的偏置值，移除后精度从11.35%提升到95.19%。通过调整代码，训练效率也得到了提升。

摘要由CSDN通过智能技术生成

下午看到一篇介绍用tensorflow实现残差网络的博文，原文在此：https://blog.csdn.net/qq_29462849/article/details/80744522#commentsedit

运行了代码，精度很低，仔细查看了代码，量比较大，由于刚看了吴恩达老师的相关课程，对这一块印象比较深，发现了一个问题，在残差模块的最后一个卷积层，也就是输出卷积层，该博主将输出和快捷连接的值相加后又加了一个偏置值，这一点在吴老师的数学推导中并没有提到，因为快捷链接是插到了最后一个卷积层的线性操作和非线性操作之间，那么直接对二者的和做ReLU就可以了，加偏置是没有必要的，经过这一点的改良后，精度大幅度提高，原来训练3000次精度为11.35%，而现在则提高到了95.19%，来看代码：

#tensorflow基于mnist数据集上的VGG11网络，可以直接运行
from tensorflow.examples.tutorials.mnist import input_data
import tensorflow as tf
import os
#tensorflow基于mnist实现VGG11
mnist = inp

了解本专栏