文章目录
前言
本文基于Pytoch框架所写,故开始正文之前,我们需了解Pytorch框架及VGG对应的文章、源码。
一、VGG网络简介
1. 关于VGG网络
VGG 网络是卷积神经网络中的一种,在 2014 的 ImageNet 竞赛中,获得了定位任务第一名和分类任务第二名的好成绩。VGG突出的贡献是:用较小的卷积滤波器(3×3)代替之前较大的卷积滤波器(7×7/5×5),通过增加深度至16-19个权重层,有效提高网络的整体性能。如图一所示,VGG模型分为4个深度,即:11、13、16、19 weight layers。其中,较为经典的是深度为16和19的VGG16、VGG19。故,对结构的讲解以VGG16为例。
2. 怎样理解11、13、16、19 weight layers的概念
对于16 weight layers,如下图绿色区域部分,13个卷积层(conv3)+3个全连接层(FC),其中不包括激活层。
3. 怎样理解VGG16工作的过程
在讨论VGG16模型工作之前,我们可以将其大致分为以下三个模块:第一,输入模块(input image);第二,特征提取模块(下图紫色方框);第三,输出模块,即分类模块(下图蓝色方框)。
下面,我们重点看一下,图片是怎样经过VGG16模型&