边框回归的损失函数_CVPR 2019:精确目标检测的不确定边界框回归

6eada6e08e7ce3c7e6b92b871e0fe9f2.png

7a4153e905cdfa1aa51064f9b1feaae5.png

63b594929d31cb600d71204b21966f3e.gif

dbd7e51b830991d8cf59701ac45ce400.png

文章发布于公号【数智物语】 (ID:decision_engine),关注公号不错过每一篇干货。

来源 | AI科技评论(id:aitechtalk)

a7374ec5a7d098eab3ed91301769bf43.png

大规模的目标检测数据集(例如MS-COCO)在进行Ground Truth框标注时仍然存在歧义。这篇论文提出了新的边界框回归损失针对目标框的移动以及位置方差进行学习,这种方法在几乎不增加计算量的基础上提高不同结构定位的准确性。另一个关键点是,由于学习了bounding box的分布,可以将其应用在NMS阶段合并相邻目标框,进一步提升定位的准确性。代码已开源。

01研究背景

在大规模目标检测数据集中,一些场景下目标框的标注是存在歧义的,这种情况如果直接使用以前目标检测的边界框回归损失,也即是Smooth L1Loss会出现学习很不稳定,学习的损失函数大的问题。Figure 1展示了哪些场景可能存在目标框标注不准确的情况:

f104778e202dad31f5e78d236175f590.png

(a,c)框的标记不准确。(b)由遮挡引起的歧义。(d)图片物体不完整,不明确物体的边界在哪里。目标检测包含分类以及定位,是一个多任务的学习问题。Faster R-CNN,Cascade R-CNN及Mask R-CNN依靠边界框回归来进行目标定位。

然而,传统的边界框损失即Smooth L1损失并没有考虑到groundtruth模糊的情形。一般来说,分类的分数越高,其边界框的回归应该更加准确,然而,这种情况不是总是发生,如Figure2所示:

779563dcf78811bdbd2a9ed1d7f3961d.png

(a)两个候选框都是不准确的。大的过大,小的过小。
(b)具有较高分类分数的边界框的左边界是不准确。(颜色更容易观察)

02相关工作

双阶段检测器单阶段检测虽然高效,但是state-of-art仍然基于双阶段检测。双阶段首先会生成proposal,进而产生大量重叠的边界框,标准的NMS会将类别分数较低,但是较为准确的框给剔除掉。本文的var voting尝试利用相邻的边界框来进行更好的定位。

目标检测损失函数Uni

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值