CoupleNet: Coupling Global Structure with Local Parts for Object Detection
背景:
R-FCN在利用了FCN之后,目标检测的效果仍然十分可观并在速度上有较大提升,比faster r-cnn快2.5-20倍,R-FCN利用的是卷积产生的位敏得分feature map(一个ROI的k*k个位置对每一类均产生一个score map),基于此进行分类等后续处理,和原来的faster r-cnn的roi pooling处理不同,R-FCN强调了位置(局部信息)。该篇论文的作者抓住R-FCN没有利用全局信息的这个点对R-FCN进行了改进。(实际上,原来的roi pooling是有利用到全局信息。那如何整合局部信息和全局信息,那就两种策略一起用!见后文)
见论文中的例子:
检测图像上的沙发,只利用R-FCN(提取局部信息)置信度非常低,全局信息就显的很需要,因为