Learning Spatial Fusion for Single-Shot Object Detection(ASFF)
Abstract
不同特征尺度之间的不一致性是基于特征金字塔的单炮探测器的主要限制。在这项工作中,提出了一种新颖的数据驱动的金字塔特征融合策略,称为自适应空间特征融合(ASFF)。它学习了空间过滤冲突信息的方法来抑制不一致性,从而提高了特征的尺度不变性,并且inference的消耗增加几乎没有。
Motivation
1.早期自下而上的路径实现多尺度特征提取会在小实例上精度较低,因为浅层特征图包含的语义信息不足。
2.研究表明跨尺度连接,通过加强特征融合可以得到精确度的提高(针对目标检测的精确度,其他领域重点关注特征提取的有效性)。
3.多尺度图像金字塔的每个图像尺度上有选择地训练和推断合适大小的物体,可以在所有level上共享丰富的语义,但是同时图像金字塔解决方案极大地增加了推理时间。(重点关注特征金字塔)
4.与图像金字塔相比,特征金字塔的一个主要缺点是不同尺度之间的不一致性,具体来说,场景中大实例通常与较高层级的特征图相关联,而小实例与较低层级的特征地图相关联。当某个对象在某个级别的要素图中被指定并视为正时,其他级别的要素图中的相应区域将被视为背景。因此,如果图像既包含小对象又包含大对象,则特征金字塔的主要部分会发生冲突。这种