Faster RCNN

最新推荐文章于 2024-08-25 18:17:58 发布

weixin_37958272

最新推荐文章于 2024-08-25 18:17:58 发布

阅读量84

点赞数

分类专栏：目标检测文章标签：算法人工智能深度学习

目标检测专栏收录该内容

16 篇文章 0 订阅

订阅专栏

Faster RCNN

3.1.2 Loss Function

为了训练rpn，我们为每个anchor分配一个二进制类标签（不管是否为对象）。我们给两种anchor分配一个正标签：（i）与ground-truth box有最高IoU的anchor。(ii)与ground-truth box的IoU交集大于0.7的anchor。请注意，一个ground-truth box可以将正标签分配给多个anchor。通常第二个条件足以确定阳性样本；但我们仍然采用第一个条件，因为在某些罕见的情况下，第二个条件可能找不到阳性样本。如果一个非正anchor的IoU比率低于0.3，我们给它分配一个负标签.anchor无论是positive的还是negative的，都无助于实现训练目标。

利用这些定义，我们在Fast R-CNN[2]中最小化了多任务丢失后的目标函数。我们对图像的损失函数定义为：

这里，i是一个小批量anchor的索引， $p_i$ 是anchor i作为对象的预测概率。如果anchor是positive的，对应的ground-truth label $p_i^*$ 为1，如果是negative的，为0。 $t_i$ 是表示预测边界框的4个参数化坐标的向量， $t_i^*$ 是positive anchor对应的ground-truth box。分类损失 $L_{cls}$ 是对数损失。对于回归损失，我们用 $L_{reg}(t_i,t_i^*)=R(t_i-t_i^*)$ 其中R为[2]中定义的鲁棒损失函数(光滑L1)。 $p_i^*L_{reg}$ 项意味着只被激活的positive anchor的回归损失 $p_i^*=1)$ 否则就会被禁用 $p_i^*=0)$ 。cls层和reg层的输出分别由 ${p_i}$ 和 ${t_i}$ 组成。

这两项用 $N_{cls}$ 和 $N_{reg}$ 规范化，并用平衡参数 $\lambda$ 加权。在我们当前的实现中（如在发布的代码中），Eqn（1）中的cls项通过小批量大小（即 $N_{cls}$ =256）规范化，而reg项通过anchor 位置的数量（即 $N_{reg}$ 大约2400）规范化。默认情况下，我们将 $\lambda$ =10，因此cls和reg项的权重大致相等。我们通过实验表明，结果在很大范围内对 $\lambda$ 值不敏感（表9）。我们还注意到，上述规范化是不需要的，可以简化。

对于边界框回归，我们采用[5]之后的4个坐标的参数化:
在这里插入图片描述

其中x、y、w和h表示方框的中心坐标及其宽度和高度。变量x、 $x_a$ 和 $x^*$ 分别用于预测框、anchor框和groundtruth box（同样用于y,w,h）。这可以被认为是从anchor框到附近groundtruth box的边界框回归。

weixin_37958272

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Faster RCNN

Faster RCNN3.1.2 Loss Function为了训练rpn，我们为每个anchor分配一个二进制类标签（不管是否为对象）。我们给两种anchor分配一个正标签：（i）与ground-truth box有最高IoU的anchor。(ii)与ground-truth box的IoU交集大于0.7的anchor。请注意，一个ground-truth box可以将正标签分配给多个anchor。通常第二个条件足以确定阳性样本；但我们仍然采用第一个条件，因为在某些罕见的情况下，第二个条件可能找不到阳
复制链接

扫一扫

专栏目录