一)简介
VGG Net由牛津大学的视觉几何组(Visual Geometry Group)和 Google DeepMind公司的研究员一起研发的的深度卷积神经网络,在 ILSVRC 2014 上取得了第二名的成绩。它主要的贡献是使用小尺寸滤波器,对网络深度进行大幅增加,展示出网络深度(推进到16-19层)对模型效果有显著提高。
二)VGGNet模型解析
论文中展示了一系列不同的VGG模型结构,如下图所示。
图中所有的网络都基于通用结构设计,只是深度不同:
A包含11个权重层一一8个卷积层,3个全连接层;
……
E包含19个权重层一一16个卷积层,3个全连接层;
右边的网络均基于A,实验表明最后两组,即深度最深的两组16和19层的VGGNet网络模型在分类和定位任务上的效果最好。
2.1)VGG-16网络结构
下面VGG-16的网络结构图,在Netscope上有更清晰的展示,大家可以自行前往,而且对每层有大致的描述:http://ethereon.github.io/netscope/#/gist/dc5003de6943ea5a6b8b