⭐ VGG
参考文献:Very Deep Convolutional Networks for Large-Scale Image Recognition(2014)
VGG Net在ILSVRC2014上取得了第二名的成绩,第一名是GoogLeNet,这里先写VGG是因为这个模型在多个迁移学习任务中的表现要优于GoogLeNet。到目前为止,VGG依然经常被用来提取图像特征,它的缺点是参数量有140M之多,耗费计算资源需要更大的存储空间,但是这个模型很有研究价值。目前常用的VGG结构为VGG-16和VGG-19。
✔️诞生背景
随着卷积网络在计算机视觉领域的应用越来越广泛,为了获得更高的准确率,越来越多的人开始在AlexNet的原始框架上进行改进。相比于2012年的AlexNet,VGG的一个改进是采用连续的3×3小卷积核来代替AlexNet中较大的卷积核(AlexNet采用了11×11,7×7,5×5的卷积核),例如用2个3×3卷积核来代替1个5×5卷积核,用3个3×3卷积核来代替1个7×7卷积核。对于给定的感受野,采用堆叠小卷积核效果优于采用大卷积核,因为多层非线性层可以增加网络深度来保证学习更复杂的模式,而且代价还比较小(参数更少)。
✔️网络结构