DSOD :Learning Deeply Supervised Object Detectors from Scratch 翻译

DSOD:从头开始深度监管学习的目标检测框架(不需要采用预训练模型)

摘要:我们提出了深度监督目标检测器(DSOD),它是一个可以从头开始学习目标检测器的框架。当下性能最好的目标检测器严重的依赖一些在大规模数据集,如imagenet上,预训练得来的模型,这种情况引发了学习偏差,这种偏差是由于分类任务和目标检测任务的损失函数和类别分布不尽相同而产生的。为检测任务进行模型微调可以在某种程度上减轻这个偏差但是并不能从根本上消除。除此之外,将预训练的模型从不同领域间的分类任务迁移到检测任务甚至更加难以实现。一个可以解决这两个问题的更好办法就是从头开始训练目标检测器,这个想法促进了我们DSOD的产生。因为目标检测任务中非常复杂的损失函数和有限的训练数据使得在这个方向所做的早期努力都付之东流。在DSOD中,我们提出了一系列设计性方法用来从头训练目标检测器。其中一个重要的发现就是深度监督方案,通过密集连接得以实现,这个方案在学习出一个良好的检测器过程中扮演了一个非常重要的角色。结合所有其他的设计方案,我们在SSD架构之上提出了DSOD。在PASCAL VOC 2007 , 2012  和MS COCO数据集上的实验结果表明,DSOD以更具影响力的模型实现了比当下性能最好的架构更高的检测精度。例如,DSOD在三个重要领域以实时检测的速度表现的比SSD更加优秀,并且仅仅需要相当于SSD1/2的参数和1/10faster rcnn的参数。

1.引言

     卷积神经网络已经在很多计算机视觉任务的领域产生了深刻的影响,诸如图像分类,目标检测,图像分割,在过去这么多年,许多具有开创性的卷积神经网络结构被提出来。Szegedy提出了一种”inception“模块将由不同尺度卷积核产生的特征图级联起来。He提出了带有短连接的残差学习模块,这使得训练超过100层的非常深的网络变为可能。Huang提出了密集连接形式的DENSENET。多亏了这些卓越的网络结构,使得许多计算机视觉任务的精确度大大提升。在这些方向中,目标检测其中一个发展快速的领域,因为其在监控和无人驾驶等等方向的广泛应用。

    为了获得更佳的表现,大量优秀的目标检测系统都在基于imagenet预训练的网络结构上进行微调。这个微调过程也被看为迁移学习。从预训练模型开始微调至少又两个优势。第一,这使得当下很多最杰出的模型文件可以直接获取。第二,微调后可以快速的产生最终的模型,而且相比于分类任务而言对训练数据的标签需要更少。

     然而在目标检测架构中采用预训练模型也具有极其严重的限制。(1)有限的结构设计空间。预训练模型结构大部分来自于在基于imagenet训练的分类任务,而这些结构往往都是非常大的——包含巨大的参数量。现有的目标检测框架直接采用预训练网络,会导致在调整网络上失去了很多的灵活性(甚至是网络结构一些很小的改进)。同时大量网络参数量的结构也非常占用

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值