Is Faster R-CNN Doing Well for Pedestrian Detection?论文阅读

行人检测是深度学习物体检测中的挑战,尽管Faster R-CNN在一般物体检测中有良好表现,但在行人检测上效果不佳。论文分析了Faster R-CNN在行人检测中的问题,认为小尺寸行人导致特征不明显和背景干扰造成的假阳性是主要原因。为解决这些问题,论文提出了在浅层特征上提取特征并使用Boosted Forest进行分类的方法。实验证明,这种方法在提升行人检测性能上有显著效果。
摘要由CSDN通过智能技术生成

原文链接:http://arxiv.org/pdf/1607.07032v2.pdf
源码链接:https://github.com/zhangliliang/RPN_BF/tree/RPN-pedestrian

简介:行人检测是个特定课题,而不是一般的物体检测。虽然最近流行的深度物体检测方法 如: Fast/Faster RCNN 在一般的物体检测中,取得了比较理想的结果,但是在行人检测方面却不太成功。论文研究了 Faster RCNN 在行人检测中存在的问题,发现 RPN 在单独的行人检测器中表现良好,但是随后的分类器却降低了性能。论文作者猜想可能是如下两个原因导致的:
1)行人在图像中的尺寸较小。对于小物体,RoI池化层在低分辨率特征图(其实就是最后共享的特征图)中提出的特征没有什么区分能力(太小以至于特征消失)。针对该情况,论文在更大尺寸的浅层特征上提取特征,以此提高提出特征的区分能力。
2)行人检测中的FP(假阳性)主要是背景的干扰,而一般物体检测主要受多种类影响。对此论文使用了 cascaded Boosted Forest 直接训练 RPN 提出的深度卷积特征。
在这里插入图片描述

实现方法:论文的方法主要包含两部分:一是用于生成候选框及卷积特征映射的RPN;二是使用这些卷积特征对候选框进行分类的Boosted Forest。具体实现如下:
1)行人检测的RPN网络采用单横纵比0.41(行人平均宽高比),从40像素高度开始步长为1.3× 的9个尺度的锚。
2)从RoI提取的固定长度的特征输入到BF分类器,不对维数做任何限制。在特征提取阶段还使用àtrous技巧来计算分辨率更高的卷积特征映射。
3)BF采用AdaBoost算法。其中RPN看作stage-0的分类器f_0,采用RealBoost设置f_0, f_0=0.5×log⁡(s/(1-s)),其中s是提议区域的分数。

实现结果
在这里插入图片描述

由于我所需仅为KITTI数据集下的结果,所以这里只放了KITTI的结果。
从上表可以看出论文提出的方法对于提升行人检测的性能还是很有效的。

参考https://blog.csdn.net/cv_family_z/article/details/52397122

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值