Tensorflow实现VGG网络

最新推荐文章于 2024-08-18 22:00:00 发布

Tom Hardy

最新推荐文章于 2024-08-18 22:00:00 发布

阅读量3.3k

点赞数 2

分类专栏：深度学习

本文链接：https://blog.csdn.net/qq_29462849/article/details/80268094

版权

VGGNet是深度卷积神经网络，由Visual Geometry Group和DeepMind合作开发，ILSVRC 2014比赛中取得优异成绩。其结构以3x3小卷积核和2x2最大池化层堆叠，探索深度与性能关系。VGGNet常用于图像特征提取，提供预训练模型。本文聚焦于VGG11模型在mnist数据集上的简化实现及实验结果。

摘要由CSDN通过智能技术生成

VGG介绍

VGGNet 是牛津大学计算机视觉组（Visual Geometry Group）和 Google DeepMind 公司的研究员一起研发的的深度卷积神经网络，在 ILSVRC 2014 上取得了第二名的成绩，将 Top-5错误率降到7.3%。

VGGNet 探索了卷积神经网络的深度与其性能之间的关系，通过反复堆叠3´3的小型卷积核和2´2的最大池化层，VGGNet 成功地构筑了16~19层深的卷积神经网络。VGGNet 相比之前 state-of-the-art 的网络结构，错误率大幅下降，并取得了 ILSVRC 2014 比赛分类项目的第2名和定位项目的第1名。

同时 VGGNet 的拓展性很强，迁移到其他图片数据上的泛化性非常好。VGGNet 的结构非常简洁，整个网络都使用了同样大小的卷积核尺寸（3´3）和最大池化尺寸（2´2）。到目前为止，VGGNet 依然经常被用来提取图像特征。VGGNet 训练后的模型参数在其官方网站上开源了，可用来在 domain specific 的图像分类任务上进行再训练（相当于提供了非常好的初始化权重），因此被用在了很多地方。

网络结构

VGGNet 论文中全部使用了3´3的卷积核和2´2的池化核，通过不断加深网络结构来提升性能。下图所示为 VGGNet 各级别的网络结构图，以及随后的每一级别的参数量，从11层的网络一直到19层的网络都有详尽的性能测试。虽然从A到E每一级网络逐渐变深，但是网络的参数量并没有增长很多，这是因为参数量主要都消耗在最后3个全连接层。前面的卷积部分虽然很深，但是消耗的参数量不大，不过训练比较耗时的部分依然是卷积，因其计算量比较大。这其中的D、E也就是我们常说的 VGGNet-16 和 VGGNet-19。C相比B多了几个1´1的卷积层，1´1卷积的意义主要在于线性变换，而输入通道数和输出通道数不变，没有发生降维。

简化

由于VGG模型参数过大，在这里只讨论VGG11模型，并在mnist数据集上进行测试。因为mnist数据集中的图像尺寸为28*28，所以对max_pooling处理次数有所要求，这一点在下面的源码中有对应。注意，因为VGG属于模型参数比较大的网络，当应用在自己的数据时（比如224*224）一定要小心！！！

源代码

#tensorflow基于mnist数据集上的VGG11网络，可以直接运行
from tensorflow.examples.tutorials.mnist import input_data
import tensorflow as tf
#tensorflow基于mnist实现VGG11
mnist = input_data.read_data_sets('MNIST_data', one_hot=True)

x = tf.placeholder(tf.float32, [None, 784])
y_ = tf.placeholder(