原论文地址:Very Deep Convolutional Networks for Large-Scale Image Recognition
摘要:
主要研究了深度对卷积网络在大规模图像识别中的准确率的影响。主要贡献是:对使用很小的卷积核(3*3)来增加深度的网络进行了评估,表明通过将深度提升到16-19个权重层,能得到很好的性能。
介绍:
随着卷积网络在计算机视觉领域的应用越来越广泛,为了获得更高的准确率,越来越多的人尝试在krizhevsky2012imagenet中的原始框架上进行改进。例如,ILSVRC-2013最好的参赛模型在第一个卷积层上使用了较小的接受域窗口以及较小的滑动步长。另一种改进方案是在整幅图像以及它的多个尺寸上,稠密的训练和测试网络。本文中,我们关注了卷积网络结构设计中的另一个重要因素——深度。为此,我们固定了网络框架的其他参数,然后通过增加更多的卷积层来增加网络的深度,这是可行的,因为我们在所有层都是用非常小(3×3)的卷积滤波器。
文章组织结构:在Sect.2 中,描述了我们的卷积网络框架。Sect.3 介绍了图像分类任务的训练和评估的主要细节。Sect.4 在ILSVRC分类任务上对不同框架进行了对比。Sect.5 对本文进行了总结。为了文章的完整性,我们在Appendix A 中描述了我们的ILSVRC-2014目标定位系统,并在Appendix B 中讨论了非常深的特征对于其他数据集的泛化能力。最后,Appendix C 包含了本文的主要修订记录。
Sect.2 convent configurations
相同的卷积层都用相同的方式设计。在本章,首先介绍了卷积网络的通用结构,然后描述了在评估中的具体配置细节。最后讨论了我们的设计选择,并与之前最好的网络进行了比较。