Repulsion Loss 论文笔记

本文介绍了Repulsion Loss,一种针对密集人群中遮挡问题的损失函数。论文探讨了遮挡对行人检测的影响,并通过Repulsion Loss的三个组成部分——Attraction Term、Repulsion Term (RepGT) 和 Repulsion Term (RepBox)来优化检测结果。实验表明,Repulsion Loss能有效减少漏检和误检,提高检测器的鲁棒性。
摘要由CSDN通过智能技术生成

论文: Repulsion Loss: Detecting Pedestrians in a Crowd
论文地址: https://arxiv.org/abs/1711.07752
代码地址: https://github.com/bailvwangzi/repulsion_loss_ssd

这是一篇 face++ 和同济大学联合出品的论文,主要的 motivation 是解决密集人群中的遮挡检测问题,从两个方面入手,一个方面是吸引目标框向 target 靠拢,另外一个方面是同时防止候选框向周围的目标移动。

介绍

我们知道在密集人群检测中,遮挡是一个非常大的挑战,同时遮挡也分为两个类型,一种是类内遮挡(inter-class occlusion),也就是被相同种类的目标遮挡,一种是类间遮挡(intra-class occlusion),也就是被不同种类的目标遮挡。遮挡会导致一些严重的后果,比如两个人很近的重叠在一起,检测的时候框就会 confused 该靠近哪个目标,这个时候框会出现偏移,可以看看图1的结果,预测的虚线框会往蓝色的框上面靠拢。在用 non-maximum supression (NMS) 做后处理的时候,偏移的框就有可能被 NMS 抑制,出现漏检的情况,换句话说,遮挡会让检测器对 NMS 的 threshold 比较敏感,如果 threshold 设置的比较高,会出现很多的误检,如果 threshold 设置的比较低,目标偏移的框就会被抑制,从而出现漏检。考虑到密集人群周围的物体对 target 的影响,这篇文章设计了一个新的 loss 函数叫做 repulsion loss 来解决这个问题。除此之外,我觉得这篇文章还有一个比较好的贡献就是研究了密集人群检测中到底是哪些因素会对检测器的效果有影响。

人群遮挡的影响

作者通过 baseline Faster R-CNN 来探索人群遮挡对 detector 的影响,将 CityPersons 的数据集分成了三个部分,分别叫做 Reasonable-crowd, Reasonable-occResonable。所有的验证集就是 Reasonable,而 CityePerons 提供了每个行人的可见区域,所以根据公式 o c c ≜ 1 − a r e a ( B B o x v i s i b l e ) a r e a ( B B o x ) occ \triangleq 1 - \frac{area(BBox_{visible})}{area(BBox)} occ1area(BBox)area(BBoxvisi

  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值