Facebook一起开源的3个程序之一,MultiPath,其代码网址:https://github.com/facebookresearch/multipathnet。
文章简介:
这篇文章对于COCO数据集中的小目标难检测问题,主要在Fast RCNN detector的基础上进行了改进,获得了新的detector:MultiPath detector。思想上改进如下:
(1)在中间网络层通过skip connections得到multi-stage feature aggregator,更好适应多尺度
(2)分类网络修改成foveal structure,来改善定位精度
(3)修改loss函数,优化重叠区域定位,获得更高的精度
实验结果总体上看:DeepMask proposal+MultiPath classifier,AP 33.5,对比Fast RCNN detector+Selective Search proposal, AP 19.3。
网络结构如上图,在步骤上的三个key修改:
(1)classifier head从1个变成4个,来在foveal regions中,观察bounding box附近的多尺度的context regions;
(2)每个heads获得conv3,conv4,conv5层的结合特征;
(3)4个classifier的输出串联在一起,并用loss整合计算分数。
Loss函数:
原始的RCNN的分类层loss如下:
其loss并不能很好地在IoU较高的情况下适应,因为所有的大于50的IoU都被看成一样的,因此本文对Lcls进行了修改,得到了新的loss函数如下:
Results and Analysis: