loss for bounding box

最新推荐文章于 2023-06-15 10:09:38 发布

linton68

最新推荐文章于 2023-06-15 10:09:38 发布

阅读量924

点赞数

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xiaolt90/article/details/107928972

版权

深度学习专栏收录该内容

6 篇文章 0 订阅

订阅专栏

概述

本文主要汇总目标检测算法中用于计算bounding box偏差的loss函数。

Smooth L1 Loss

由微软rgb大神于Fast RCNN论文提出该方法

（1）假设 $x$ 为预测框和真实框之间的数值差异，则 $L_{1}$ 、 $L_{2}$ 和 $Smooth_{L_{1}}$ $L o s s$ 定义为：

$L_{1} = \mid x \mid$

$L_{2} = x^2$

$Smooth_{L_{1}}(x) = \begin{cases} 0.5x^2, \qquad if \mid x \mid<1 \\ \mid x \mid - 0.5, othreswise \end{cases}$

（2）3个损失函数对 $x$ 的导数分别为：
$\cfrac{\mathrm{d}L_{1}(x)}{x} = \begin{cases} 1, \qquad if x \geq 0 \\ -1, \quad otherswise \end{cases}$

$\cfrac{\mathrm{d}L_{2}(x)}{x} = 2x$

$\cfrac{\mathrm{d}Smooth_{L_{1}}(x)}{x} = \begin{cases} x, \qquad if \mid x \mid < 1 \\ \pm 1, \quad otherswise \end{cases}$

从损失函数对 $x$ 的导数可知：

$L_{1}$ 损失函数对 $x$ 的导数为常数，在训练后期， $x$ 很小时，如果学习率不变，损失函数会在稳定值附近波动，很难收敛于更高的精度。
$L_{2}$ 损失函数对 $x$ 的导数在 $x$ 很大时，其导数也非常大，在训练初期不稳定。
$Smooth_{L1}$ 完美的避开了 $L_{1}$ 和 $L_{2}$ 的缺点。

（3）实际目标检测回归任务中的loss为：
$L_{loc}(t^u, v) = \sum_{i \in (x,y,w,h)} Smooth_{L_{1}}(t_{i}^u-v_{i})$
其中， $v$ 表示GT的框坐标， $t^u$ 表示预测的框坐标，即分别求4个参数的Loss，然后相加得到Bounding Box Regression Loss。这种方式的前提是假设4个参数是相互独立的，然而4个参数本身是有一定的相关性的。

IoU Loss

论文UnitBox: An Advanced Object Detection Network提出改方法

$L_{iou} = -ln(iou)$
存在问题：

当预测框和目标框不相交（ $i o u = 0$ ）时，不能反映预测框与目标框距离的远近，损失函数此时不可导，无法优化2个框不相交的情况；
当预测框和目标框大小确定，只要2个框的相交值是确定的， $i o u$ 值就相同，所以 $i o u$ 不能反映2个框是如何相交的。

GIoU Loss

论文Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression提出该方法

$\cfrac{\mid B \bigcap B^{gt} \mid}{\mid B \bigcup B^{gt} \mid}$

$\cfrac{\mid C - (B \bigcup B^{gt}) \mid}{\mid C \mid}$

$L_{GIoU} = 1 - GIoU$

其中： $B$ 为预测框， $B^{gt}$ 为真实框， $C$ 为 $B$ 和 $B^{gt}$ 的最小外接矩形。

DIoU Loss

论文Distance-IoU Loss: Faster and Better Learning for Bounding Box Regression提出该方法

$L_{DIoU} = 1 - IoU + \cfrac{\rho^2(b,b^{gt})}{c^2}$

其中：

$b$ 和 $b_{gt}$ 分别表示预测框和目标框的中心点
$\rho(\cdot)$ 表示欧氏距离
$c$ 表示预测框和目标框的最小外接矩形的对角线长度

CIoU Loss

论文Distance-IoU Loss: Faster and Better Learning for Bounding Box Regression提出该方法

$C I o U L o s s$ 在 $D I o U$ 惩罚项的基础上加了一个影响因子 $\alpha \upsilon$ ，这个因子把预测框长宽比拟合目标框的长宽比考虑进去。

$\upsilon = \cfrac{4}{\pi^2}(arctan(\cfrac{w^{gt}}{h^{gt}}) - arctan(\cfrac{w}{h}))^2$

$\alpha = \cfrac{\upsilon}{(1-IoU)+\upsilon}$

$L_{CIoU} = 1 - IoU + \cfrac{\rho^2(b,b^{gt})}{c^2} + \alpha \upsilon$

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
loss for bounding box

概述本文主要汇总目标检测算法中用于计算bounding box偏差的loss函数。Smooth L1 Loss由微软rgb大神于Fast RCNN论文提出该方法（1）假设xxx为预测框和真实框之间的数值差异，则L1L_{1}L1、L2L_{2}L2和SmoothL1Smooth_{L_{1}}SmoothL1 LossLossLoss定义为：L1=∣x∣L_{1} = \mid x \midL1=∣x∣L2=x2L_{2} = x^2L2=x2SmoothL1(x)=.
复制链接

扫一扫

专栏目录

linton68 CSDN认证博客专家 CSDN认证企业博客

码龄13年

12: 原创

21万+: 周排名

105万+: 总排名

2万+: 访问

: 等级

338: 积分

1: 粉丝

13: 获赞

13: 评论

44: 收藏

私信

关注

热门文章

分类专栏

深度学习 6篇
tensorflow 2篇
Opencv 2篇
Python 1篇

最新评论

如何利用cocoapi评估模型在coco数据集上的AP
weixin_63052204: 您好，请问这个指标可以用到关键点检测上面吗？
如何利用cocoapi评估模型在coco数据集上的AP
KUMORII: 您好，请问您解决这个问题了吗，我也遇到了相同的问题，请教
如何利用cocoapi评估模型在coco数据集上的AP
KUMORII: 您好，我是用ssd训练coco数据集，但是ssd目前只支持voc格式的测试结果，最后输出的是各个类别的.txt文件。请问我应该怎么把这些txt文件转成json文件呢？文件的顺序有要求吗，还是只是按照上面的格式把所有的txt文件整合到一起就可以呢。小白一枚，有很多不懂的，如果您有时间的话可以回复我一下吗？非常感谢您
如何利用cocoapi评估模型在coco数据集上的AP
linton68: xml文件不是必须的，主要是讲输出的测试结果按照上述的格式组织好，然后json.dump生成json文件即可。
如何利用cocoapi评估模型在coco数据集上的AP
叶凛离: 您好，我是用efficinetNet模型进行训练，最后用model_inspect输出测试结果，结果为标注的图片并没有xml文件。请问这种情况该如何输出json文件呢？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。