VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION

这篇论文探讨了卷积网络的深度如何影响其在大规模图像识别任务中的准确性。作者通过使用3x3卷积滤波器并逐步增加网络深度,展示了在不牺牲空间分辨率的情况下,增加网络层数能显著提升性能。实验结果表明,这种结构不仅在ILSVRC分类和本地化任务中表现出色,还能适应其他图像识别任务。论文还涉及网络初始化、训练策略和测试方法,如mini-batch梯度下降、多尺度训练和模型融合等。
摘要由CSDN通过智能技术生成

论文:Very Deep Convolutional Networks for Large-Scale Image Recognition
该篇文章介绍了卷积网络深度在大规模图像识别环境中对其准确性的影响。 它主要贡献是使用具有非常小(3×3)卷积滤波器的体系结构对增加深度的网络进行全面评估,这表明将深度推至16-19重量可以实现对现有技术配置的重大改进 层,它公开提供了两个性能最佳的ConvNet模型。

他们讨论了ConvNet架构设计的另一个重要方面—深度。为此,他们修复结构的其他参数,和稳步增长的深度网络通过添加更多的回旋的层,这是可行的由于使用非常小(3×3)卷积过滤器在所有层。
他们想出更精确的事先架构,不仅实现了先进的准确性在ILSVRC分类和本地化的任务,但也适用于其他图像识别的数据集,使用时,他们甚至实现性能优良的一个相对简单的管道pipeline(如深线性SVM分类的特性不带微调)。

ConvNet结构具体配置

①在训练中,该网络是一个固定大小的输入224×224 RGB图像。我们所做的唯一预处理是从每个像素中减去在训练集上计算的平均RGB值。
②图像通过卷积层的堆栈传递,其中网络使用接受域很小的过滤器:3x3(这是捕捉左/右、上/下、中心概念的最小尺寸)。在其中一种配置中,我们还使用了11个卷积滤波器,它可以被看作输入通道的线性变换(后面是非线性)。卷积步长固定为1像素;空间填充是指经过卷积后保留空间分辨率,即3个卷积层的填充为1像素。
③后面由5个max-pooling层执行,它们遵循一些conv层(不是所有conv层都遵循max-pooling)。Max-pooling是在一个22像素的窗口上执行的,步长为2。
④所有隐藏层均使用ReLU。

如表1所示,每

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值