ASFF:Learning Spatial Fusion for Single-Shot Object Detection
论文:Learning Spatial Fusion for Single-Shot Object Detection
论文地址:https://arxiv.org/pdf/1911.09516.pdf
github:https://github.com/ruinmessi/ASFF
本篇文章最大的创新点是提出了一种新的特征融合的方式ASFF,通过学习权重参数的方式将不同层的特征融合到一起,作者证明了这样的方法要优于通过concatenation或者element-wise的方式。因而本博文只介绍ASFF的详细结构。
ASFF
ASFF称为自适应空间特征融合,其思路非常简单,就是为了改进FPN进行特征融合时只是暴力地将高层特征图上采样然后进行像素级的相加操作。ASFF通过对每张融合的特征图设置自学习的权重来进行加权融合。
例如上图中有三张不同尺度的特征图,称为Level1、Level2、Level3,分别α3,β3和γ3相乘在相加,就构成了ASFF-3。