VGG-16
Karen Simonyan 在《Very Deep Convolutional Networks for Large-scale Image Recognition》中讨论了卷积网络的深度对其在大规模图像识别的准确性的影响。作者比较了5中不同深度的卷积网络,其中深度为16的网络——VGG-16成为一种经典的网络架构。许多网络都是在VGG-16的基础上删除和添加其他层。
VGG-16 Architecture
这里只介绍VGG-16的架构,这是用的最多的一种网络,论文中的其它4个就不介绍了。
VGG-16的网络很简单,有13个卷积层(被5个max-pooling层分割)和3个全连接层。所有卷积层的过滤器大小都是 3×3 3 × 3 ,步长为1,进行padding。作者设置所有卷积层的过滤器大小都为 3×3 3 × 3 是有原因的,因为过滤器尺度更大的卷积层可以使用多个 3×3 3 × 3 卷积层来达到同样的效果,比如2个连在一起的 3×3 3 × 3 卷积层(步长为1)的接收域与 5×5 5 × 5 的卷积层的接收域一样。作者还给出了更多的解释,首先,使用多个