Repulsion Loss: 解决行人检测中密集遮挡问题

作者:H.SH
来源:CSDN
原文:https://blog.csdn.net/weixin_42615068/article/details/82391354
论文题目:Repulsion Loss: Detecting Pedestrians in a Crowd
论文链接:https://arxiv.org/abs/1711.07752

motivation:

目标检测的目的是使产生的proposal能更加接近真是目标框GT,而行人检测中经常会遇到行人密集拥挤的情况,文中称作crowd occlusion,使得训练输出的预测框会由于周围其他目标的影响而干扰最终的输出结果(从下图可以看出)。那么可不可以通过一种方式,阻止proposal由于crowd occlusion而偏移到周围目标框的情况 ?论文中写道“the attraction by target, and the repulsion by other surrounding objects”,即使得预测框更加接近所负责的真实目标框,而远离周围的目标。
在这里插入图片描述

innovation point:

通过设置损失函数的方式,即Repulsion Loss,使预测框和所负责的真实目标框的距离缩小,而使得其与周围非负责目标框(包含真实目标框和预测框)的距离加大 。如下式,如果与周围目标的距离越大,损失值会越小。

在这里插入图片描述

detailed information in the paper:

1、crowd occlusion 的影响

More Missed Detections and False Positives:
occlusion的定义:在这里插入图片描述, BBox-visible在CityPersons数据集中会单独标记出来,即没有被遮挡的部分。
occlusion case:真实目标的occ>=0.1
crowd occlusion case: 真实目标的occ>=0.1,并且与其他任何真实目标的IoU>=0.1
在这里插入图片描述

从上图可以看出,预测框偏移相邻目标而造成更多的False Positives, 而且这些预测框往往会有更高的confidence score(这使得会更加容易被归类为False Positives).

2、Repulsion Loss

定义:
在这里插入图片描述
损失函数共包含三部分,第一部分为预测框与真实目标框所产生的损失值(attraction term);第二部分为预测框与相邻真实目标框所产生的损失值(repulsion term(RepGT));第三部分为预测框与相邻不是预测同一真实目标的预测框所产生的损失值(repulsion Box(RepBox))。通过两个相关系数alpha和beta来平衡两部分repulsion损失值。论文中试验结果显示两个相关系数都设置为0.5取得了较好的效果。

Attraction term:

目的使预测框与真实目标框更加接近,沿用 Smooth_L1 构造吸引项。给定一个 proposal P ∈ P_+(所有的正样本),为每个proposal匹配一个与之有最大IoU值的真实目标框:G^P_Attr = arg max_G∈G IoU(G,P)。B^P 是回归 proposal P 的预测框。Attraction Term的定义为:
在这里插入图片描述

Repulsion Term(RepGT):

目的使预测框远离与之相邻的真实目标框。给定一个 proposal P ∈ P_+,它的排斥 ground truth 物体被定义为除了其指定目标之外带有最大 IoU 区域的 ground truth 物体(在这里插入图片描述)。RepGT 损失被计算以惩罚 B^P 和 G^P_Rep 之间的重叠(由 IoG(在这里插入图片描述 )定义)。IoG(B, G) ∈ [0, 1] ,从而 RepGT 损失可写为:
在这里插入图片描述
在这里插入图片描述

Repulsion Term(RepBox):

在这里插入图片描述目的使预测框远离相邻不是预测同一真实目标的预测框。首先根据真实目标框GT将P_+分为不同的子集,,然后使得来自与不同子集的proposal的overlap尽可能的小。RepBox 损失可写为:
在这里插入图片描述
分母中的示性函数表示:必须是有交集的预测框才计入损失值,如果两个proposal完全不相邻,则不计入。 RepBox 损失可以降低 NMS 之后不同回归目标的边界框合并为一的概率,使得检测器在密集场景中更鲁棒。
在这里插入图片描述

注:关于Smooth_ln

通过σ,来调整repulsion loss对outliers(这些有较大overlaps的boxes pair)的敏感性。RepBox相对于RepGT有更多的outliers,所以应该弱化其对σ的敏感性,论文实验中RepGT和RepBox分别在σ=1和σ=0取得更好的效果。


  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值