尺度感知的三叉目标检测网络
摘要
首先进行感受野对物体检测中尺度变化的影响的探索实验。由探索试验提出Trident Net,构造了一个并行的多分支体系结构,其中每个分支共享参数,具有不同的接受域。采用尺度感知训练方式,在适当尺度的位置上采样对象进行训练,对每个分支进行专门化。带有ResNet-101主干网的TridentNet实现了48.4map。
一.介绍
目标:通过为所有尺度创建具有统一表示能力的特征,从而使得对于不同尺度的物体具有不同的接受场。
本文提出一种新的网络结构,如下图所示c,创建多尺度特征图。借助扩张卷积,三叉块的不同分支具有相同的网络结构,共享相同的参数,但具有不同的感受野。为了避免使用极端尺度的训练对象,使用尺度感知的训练方案,使每个特定于给定尺度范围的分支与其接收场相匹配。
贡献如下:
1. 提出关于感受野在尺度变化中的作用的研究结果。
2. 使用三叉块来解决目标检测的尺度变化问题。通过多分支结构和尺度感知训练。
3. 提出TridentNet-fast
4. 本方法with ResNet-101的单一模型实现了48.4的mAP。
二. 相关工作
Deep Object Detectors. 多阶段,单阶段
Methods for handling scale variation.
Dilated convolution.
三. 感受野研究
骨干网的设计有几个因素可能影响性能,下采样率、网络深度和感受野。
使用不同的扩张率控制网络感受野,具有扩张率ds的扩张卷积在连续滤波器值之间插入ds-1个零,在不增加参数和计算成本的情况下增大核大小。具体地说,一个3×3的扩展卷积可以具有与核大小为3+2(ds-1)的卷积相同的感受野。假设当前特征映射的总步长为s,则扩张率ds的扩张卷积可以使网络的接收场增加2(ds-1)s,因此,如果用ds扩展速率修改n个conv层,则接收场可以增加2(ds-1)sn。
实验结果:
结果表明:
1. 不同尺度物体的检测受感受野影响很大
2. 增大扩张率,扩大有效感受野,利于大目标检测,降低小目标性能
四. 三叉网络
1.网络结构
2. 尺度感知训练方案
为每个分支i定义了一个有效范围[li,ui],在训练过程中,只选择落在每个分支相应有效范围内的建议和真值框。具体来说,对于输入图像上宽度为w、高度为h的感兴趣区域(RoI)(在调整大小之前),在以下情况下,它对分支i有效:
3. TridentNet-fast 推理
为减少TridentNet推理时间,提出TridentNet-fast ,在推理过程中使用一个主分支来近似估计三个分支的结果,这个主分支为中间分支,因为它的有效范围包括大目标和小目标。速度提高很大,精度减少很小,这是由于主分支的权值在其他分支上共享,因此在尺度不可知方案中训练所有分支相当于在网络内进行多尺度增强。
五. 实验