注:由于前人的总结工作已经做得很好,这里仅仅给出博主认为值得借鉴的思想及参考文献,有需要再补充。
一.通读全文
论文链接:https://arxiv.org/abs/1811.11168.
论文翻译:Deformable Convolutional Networks v2 可变形卷积v2版翻译.
Motivation: DCN v1中采样的特征超出ROI(即offset不可控导致引入了过多的context,而这些context可能是有害的)。
Resolutions:
- Stacking More Deformable Conv Layers
- Modulated Deformable Modules:使DCN在学习offset的基础上,再学习offset采样的权重
- R-CNN Feature Mimicking:R-CNN as teacher network,让DCNV2的ROIPooling之后的feature去模拟R-CNN的feature。
二.剖析模块
目标检测论文阅读:DCN v2.
Deformable ConvNets v2算法笔记.
如何评价 MSRA 视觉组最新提出的 Deformable ConvNets V2?(*).
论文阅读:Deformable ConvNets v2: More Deformable, Better Results.
论文阅读:DCNv2:Deformable ConvNets v2: More Deformable, Better Results.
Deformable Convolution v1, v2 总结.
三.总结
增加defomable covolution layers简单但很实用;
提升检测识别的精度关键在于学习到准确的特征,除了用权重控制offset采样这一想法,R-CNN as the teacher也很值得深思。(此外*中有作者提到,小物体的检测在于放大,如SNIP/SNIPER,这里我后面看过再总结。)