链接
SpineNet: Learning Scale-Permuted Backbone for Recognition and Localization
摘要
图像分类任务通常采用逐步减小分辨率的网络结构,但是这种结果并不适合同时需要识别和定位的任务。为减小分辨率损失问题,分类任务中采用encoder-decoder结构,但是该结构并不高效,尤其在需要产生强多尺度的特征时。我们将介绍一种通过NAS搜索得到的网络——SpineNet,它具有scale-permute intermediate 特征和cross-scale连接。相比ResNet-FPN,spineNet具有6%的AP增益。SpineNet结构也可以迁移到分类网络,在iNaturalist fine-grained dataset 比赛中,在top1 accuracy上比ResNet高出6%。
核心要点
- 尺度交换网络结构&和resNet的对比:
如何保证不同层之间的concate,connection本身包含conv或者deconv么?