arXiv-2018
extra stages 没有经过 Imagenet 的洗礼,object detection 任务特有的!eg FPN 的 P6, RetinaNet 的 P6,P7
FPN 对大目标定位不准(down sampling 太多了),容易漏检小目标(特征太low,如果高层 FPN 漏掉了小目标,小目标将不会被检测)
- Maintain high spatial resolution,为了减少计算量,P6 相比 P5 channels 没有 double。
- Keeping large receptive field 则是靠 dilated convolution
DetNet-59 效果比 ResNet-101都好,参数利用率更高
为目标检测的主干,那就拿目标检测的数据集试试
DetNet 定位更加精确
-
小目标 AR50 的大幅度提升表示有效的解决了漏检问题,AR85提升不明显是因为改进前后,小目标都是从P2那里去检测,没有改进融合高级语义信息的策略的话,应该都差不多,小提升来自于 DetNet stage 5 的特征更好
-
大目标 AR50 没提升,大物体的检测能力差不多,AR85的大幅度提升表示 DetNet 让大目标的定位更加准确了
生成的新 stage,skip connection 是 identity 好还是 1x1 convolution 好? 作者觉得后者比较好,能产生全新的 stage
可以看出 projection 比 no projection 效果好 !!!
和 state-of-the-art 比较一下
分割的结果