VGG网络结构如下图
在VGGNet中降低了卷积核尺寸,用多个较小的卷积核代替一个较大的卷积核,增加了卷积的层数。
一方面可以减少参数,另一方面进行了更多的非线性映射,增强了拟合能力。
比如三个3×3的堆叠卷基层的感受野是7×7,三个3×3的卷积层参数个数为:3×((3×3×C)×C)=27×C×C;一个(7×7×C)×C的卷积层参数为49×C×C。
VGGNet中对输入图片进行了去均值化
去均值化可以把数据移到原点附近,可以保证数据不会太大导致梯度出现问题。
VGGNet使用了Multi-Sale的方法做数据增强
通过将原始图像放缩,再裁切图片。
VGGNet认为LRN作用不大。可能是因为对输入图片进行去均值化后就不会出现梯度的问题了,又用了其它方式提高收敛速度。
1) 使用小卷积核和更深的网络进行的正则化;
2) 对于较浅的网络,可以直接使用随机数进行随机初始化,而对于比较深的网络,则使用前面已经训练好的较浅的网络中的参数值对其前几层的卷积层和最后的全连接层进行初始化。