arxiv 30/3/2017
Abstract
作者在这篇文章当中把目标检测问题formulate成估计一个非常大但是很稀疏的概率分布,变量就是所有可能的bounding box,一张输入图像对应的bounding box空间很大,概率P就是bounding box属于各个类别的概率。因为只有极少一部分的bounding box里面是有物体的,因此这个P是稀疏的。只在一些特定的bounding box上有值。因为样本空间很大,要对每一个可能的bounding box去预测这么一个概率分布的话是不可能的。因此,在前面的工作中,比如RCNN系列或者yolo,利用anchor box的方法对这个样本空间进行了下采样。作者这篇论文提出了一种新的下采样的方法。
DeNet的整体框图,前面的base cnn采用的是resnet34/101,后面接出两条分支,其中一条分支做corner detect,在corner detection map上去寻找概率大的bounding box,然后把这些bounding box输入后面的网络去做classification和regression
Contribution
引入了一种新的region proposal的方法,检测精度highly competetive,检测速度实时
Directed Sparse Sampling(DSS)
首先回顾一下faster rcnn中rpn的工作原理:
利用最后一层feature map,引入anchor box的机理&#