论文传送门:https://arxiv.org/pdf/1409.1556.pdf
VGG网络是十分经典的CNN网络模型,在特征提取和迁移学习任务中都经常被使用。其中使用最广泛的是VGG16和VGG19,分别代表网络层级为16层和19层。
VGG在文章《Very deep convolutional networks for large-scale image recognition》中提出,为了解决ImageNet大赛上1000类图像分类和定位问题,在网络深度不断加深的过程中,文章的实验表明,16层和19层在该任务上效果最好。
VGG分别夺得ImageNet Challenge 2014t的分类第二(第一是GoogleNet)和定位第一。VGG网络的命名是以牛津大学的Visual Geometry Group的名字缩写得到的。
VGG网络设计
关键点
- 采用3x3卷积核,小卷积核
- 卷积步长为1,不丢失信息
其它细节
- 采用ReLU非线性激活函数
- 5个最大池化层
- 无归一化
- 3层全连接层
采用3x3 layers的原因
- 堆叠后的卷积层具有更大的感受野
- 更加的非线性
- 参数的数量减少
网络配置
在文章中作者共做了六组实验,网络层数从11怎加到19,六个网络结构的配置如下:
其中D和E为VGG1