BMVC 2017 Oral
Abstract
文章指出当前的object detector大都用正框来表征一个object,尽管大多数的object都是non-rectangular的。作者提出的模型能够通过deformable parts来表述一个object。这样的话得到的特征对于物体的形变更加具有鲁棒性,并且能够part的位置信息能够提高目标定位的准确性。
Contribution:
1.提出了deformable part-based ROI pooling来优化part的位置,提高分类对于物体形变的鲁棒性
2.提出了deformable-aware localization module来显式地利用part的位置信息提高object定位的准确性
Deformable part-based ROI pooling
作者的实验主要还是在R-FCN的基础上改,deformable part-based roi pooling的示意图如下图所示:
输入是k * k * (C + 1)张特征图,其中k表示把ROI分成k*k个bins,每个bin其实就是作者所说的一个part,所谓的deformable part,和DPM里面的思想是一样的,即一个root filter对物体进行粗定位,然后一系列的part filter来对物体的各个part进行finer的定位。
在这篇文章里面对应的就是,整个ROI