中科院nlpr实验室 ICCV2017
1.Motivation
这篇文章主要是在R-FCN的基础上改的。其主要的观点就是R-FCN可以看成是对一个proposal,用一些position-sensitive的weak classifier去做检测,然后把这些classifier的检测结果ensemble起来(position-sensitive RoI pooling),因此作者指出这张方法没有考虑到region proposal的global的信息和context的信息。
2.Contribution
在原来R-FCN的基础上引入了proposal的global和context信息,通过结合part,global,context的信息,提高了检测的精度
上面这张图能够比较形象地说明作者提出了CoupleNet的效果。
(a)图里面,对于边界的物体,global的置信度不高,但是在人眼,嘴巴这些地方的local part的置信度比较高,结合之后可以得到人的检测结果。
(b)图,对于结构比较简单的物体,比如餐桌,local part整体置信度比较低,但是global的置信度会比较高,结合之后也能检测出餐桌。