先mark一下这位博主写的,写得很用心。感谢
中心思想:
继Relation Network实现可学习的nms之后,MSRA的大佬们觉得目标检测器依然不够fully learnable,这篇文章类似之前的Deformable ROI Pooling,主要在ROI特征的组织上做文章,文章总结了现有的各种ROI Pooling变体,提出了一个统一的数学表达式,藉由这个表达式,提出完全可学习,无人工设计的Region特征
不明白的地方:
g(a, b) = max(0, 1 − |a − b|) denotes the 1-D bilinear interpolation
weight
还有公式3也没有理解清楚