Very Deep Convolutional Networks For Large-Scale Image Recogntion
一、摘要
VGG的主要贡献是表明:通过增加网络深度并且使用非常小的卷积核对网络效果有很大的改善。
二、简介
通过增加深度和使用小卷积核搭建的网络不仅在ILSVRC数据集上表现好,同样也使适用其它数据集。
三、ConvNet结构
这一节详细描述了ConvNet的网络结构。
3.1结构Architecture
预处理:减去像素均值
输入:224x224RGB图像
卷积层:感受野3x3和1x1(1x1可以看出线性转换),步长1
padding:1像素 for 3x3卷积核
pooling:5个max-pooling层,跟在卷积层后面(但不是每个卷积层后都有pooling)。max-pooling的核是2x2,步长2
全连接层(FC):3个全连接层
soft-max层:最后一层
激活函数:ReLU
网络不使用局部响应响应规范化(Local Response Normalisation):因为没有提高性能,反而增加了内存消耗和计算时间。
3.2配置Configuration
网络配置
网络参数
3.3讨论Discussion
1.三个3x3感受野的叠加效果等同于一个7x7的感受野,为什么用三个3x3而不用一个7x7?
(1)使用三个非线性修正函数,使得决策函数更可分。
(2)减少了参数数量。假设通道数为C,则三个3x3参数个数为 3 ( 3 2 C 2 ) = 27 C 2 3\left ( 3^{2}C^{2} \right )=27C^{2} 3(32C2)=