VGGNet
引言:
这篇文章是自己通过看paper《VERY DEEP CONVOLUTIONAL NETWORKS
FOR LARGE-SCALE IMAGE RECOGNITION》和一些大佬博客来整理的VGGNet笔记,分享给大家。
背景:
VGG是Oxford的Visual Geometry Group提出的,也是VGGNet名字的由来。
该网络在ILSVRC-2014(ImageNet Large Scale Visual Recognition Challenge)中定位任务冠军和分类任务亚军(冠军是GooLeNet)。
主要证明了增加网络的深度能够在一定程度上影响网络最终的性能。
VGG亮点:
所有卷积层都用了 3 × 3 3 \times 3 3×3的卷积核,并且通过堆叠多个 3 × 3 3\times3 3×3的卷积核来替代大尺度的卷积核;
- 通过堆叠两个 3 × 3 3\times3 3×3的卷积核来替代 5 × 5 5\times5 5×5的卷积核
- 通过堆叠三个 3 × 3 3\times3 3×3的卷积核来替代 7 × 7 7\times7 7×7的卷积核
- 具有相同的感受野
对于给定的感受野,采用堆叠的小卷积核是优于采用大的卷积核,因为多层非线性层可以增加网络深度来保证学习更复杂的模式、让决策函数更具有判别力,同时能够大大的减少参数。
**注:**感受野讲解
某一层输出结果中一个元素所对应输入层的区域大小,
(即feature map上的一个单元对应输入层上的区域大小)
计算公式: F ( i ) = ( F ( i + 1 ) − 1 ) × S t r i d e + K s i z e F(i)=(F(i+1)-1)\times Stride+Ksize F(i)=(F(i+1)−1)×Stride+Ksize
F ( i )