【论文笔记】基于带有不确定性的边界框回归的准确目标检测

1. 摘要翻译

大尺度目标检测数据集试图尽可能清楚地定义被识别图像的真实边界框。 但我们还是注意到标注边界框的时候还是有不少混淆的地方。在这篇文章中,我们提出了一种新颖的边界框回归损失函数,可以同时进行边界框的转换和变量的确定。我们的损失函数在集中结构中极大地提高了定位的准确性,并且几乎没有额外的计算量。学习得到的本地化变量使我们可以在进行非极大值抑制的操作时合并相邻的边界框。

2. 待解决的问题

许多图片在进行特征提取的时候,目标非常模糊。提取到的结果和理想目标存在差距。有些图片本身就存在一些遮挡,边界框存在歧义。

3. 创新点

作者提出了一种新颖的边界框回归函数,称为KL Loss。为了捕捉图片识别中的不确定性,作者使用了高斯分布和德拉克δ函数。这样,新的边界框回归损失函数就被定义为预测分布与真实分布的KL散度。
使用这种分布的好处有:

  1. 数据库中的混淆度能被成功测量了,边界框回归器从模糊图片中获得的损失值降低。
  2. 学习得到的变量在后续过程中是有用的,我们使用变量投票来投票决定边界框的位置,以执行NMS时预测得到的变量作为权重。
  3. 学习得到的变量概率分布时可说明的。它反映了边界框的不确定度。

4. 网络结构与算法实现

文章中在实现部分的介绍分为三个部分:

  1. 边界框的参数化
  2. 提出KL网络,使用训练得到的置信度以训练感知网络
  3. 提出一种新的非极大值回归来提高置信度的训练准确度
4.1边界框的参数化

首先作者使用了边界框的左上角和右下角来表示框的位置,而不是传统的中心点坐标加长宽。
在这里插入图片描述
上面四个参数表示预测的偏差值,下面四个参数表示实际偏差值。接下来的文章中,作者将坐标简写为x。
作者的目标是建立一个边界框位置的概率分布。这个分布可能挺复杂的,简单起见,作者选择使用简单高斯分布。
在这里插入图片描述
Θ是一个可以学习得到的参数,σ是标准差
其中,真实点也是可以用这个模型表示的,对应于σ趋向于0的情况,这种情况对于狄拉克δ函数:
(狄拉克δ函数:https://baike.baidu.com/item/狄拉克δ函数/5760582)
在这里插入图片描述
当输入点就是标准点时,概率趋向无穷大,其他时候概率为0

4.2使用KL损失函数进行边界框回归

这篇文章的目标是使得N个样例下,网络预测得到的概率分布与标准概率分布之间的KL散度尽量小。

(关于KL散度:https://blog.csdn.net/nymph_h/article/details/95331124)
KL散度是推导交叉熵的前一步工作,用来衡量随机变量不同分布之间的差异

在这里插入图片描述
上图是对应一个单独的样例而言的公式。注意后面的H函数是标准分布的熵(信息量的期望),由第二行第一部分得到,之前的三项是由后面的式子积分得到的。
如果预测位置Xe并不准确,我们希望网络能预测更大的标准差,损失函数Lreg也会小一些。
由上式可以看出,方程的后两项中没有自变量,当标准差的值为1时,整个式子可以简化成只有第一项。
当对Xe和σ分别进行学习时,分别用到不同的偏导
在这里插入图片描述
由于在σ在分母里,刚开始进行训练的时候可能造成参数爆炸(σ很小,原式很大),所以在训练的时候,使用α = log(σ2)代替σ。式子变为:
在这里插入图片描述
当r |xg − xe| > 1时,使用更接近L1范数的损失函数:
在这里插入图片描述
作者在全连接层使用了随机的高斯初始化,标准偏差和平均值设为0.0001和0,所以在训练刚开始时KL损失函数会比较接近L1损失函数

4.3另一种非极大值回归

在我们获得预测位置的方差之后,通过学习得到的相邻边界框的方差为候选边界框投票就是很直观的了。
算法1:变量投票
β是一个Nx4的矩阵,表示初始预测框。
S包含相应的预测分数
C是一个Nx4的矩阵,表示对应的方差
D是最后的检测结果集
σt是变量投票的一个可调参数,蓝色行和绿色行分别是软性NMS和变量投票。
在这里插入图片描述
作者在标准NMS和soft-NMS的循环中对选中的边界框位置进行了投票,首先选中评分最高的方框,它的新位置通过它本身和它的相邻方框计算得到。首soft-NMS启发,作者赋予更近的,确定性更高的方框更大的权值。
不同方框之间的影响计算如下所示(Xi对X的影响)
在这里插入图片描述
σt是一个可调变量。方差高的,交并比小的方框权值影响小。分类得分不影响投票。

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值