Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression阅读笔记

不知道叫啥好一点

于 2020-12-29 11:37:31 发布

阅读量431

点赞数

分类专栏：目标检测文章标签： GIoU

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/A_A666/article/details/111868460

版权

GIoU Loss阅读笔记

（一）Title

在这里插入图片描述
前言:博主查找改进IoU Loss的论文，没有找到2020年的相关论文，仅仅找到3篇论文，分别对应着IoU Loss，GIoU Loss,DIoU/CIoU

UnitBox: An Advanced Object Detection Network(IoU Loss,2016)
Generalized Intersection over Union: A Metric and ALoss for Bounding Box Regression （GIOU Loss; CVPR2019）
Distance-IoU Loss:Faster and Better Learning for Bounding Box Regression（DIOU Loss & CIoU Loss ; CVPR2019）

本篇文章主要基于GIoU Loss。作者在文中指出利用bounding box属性(长宽等)以及L1,L2等距离损失函数进行回归，度量IoU之间并没有一个很强的相关性

（二）Summary

Intersection over Union(IoU)是目标检测benchmarks中最常用的评估指标。然而，借助常用的距离损失函数 $s m o o t h l 1, l 1$ 以及 $M S E$ bounding box的参数，和度量(IoU)最大化之间存在着一定的差异

从上图中可以看出，尽管distance loss的值是相同的，但IoU之间仍然存在着较大的差异，不过同时也可以看出，作者使用的GIoU和真实IoU之间存在很小的差异。

接着作者提出：The optimal objective for a metric is the metric itself。

可是使用IoU作为回归目标，若两个bounding box之间没有交集，也就是IoU的值为0，此时是无法利用IoU来进行优化的。

因此，作者在本文中引入既作为新损失又作为新度量的generalized IoU (GIoU) 来解决IoU存在的问题。

本文的主要贡献：

作者将IoU进行扩展，得到Generalized IoU，作为两个任意形状之间的度量
并且作者提出的GIoU可以作为两个轴对齐(axis-aligned)矩形的损失函数
将GIoU引入到当前的目标检测框架Faster R-CNN，Mask R-CNN以及YOLO v3中，能够实现性能上的提升

（三）Research Object

本文主要研究目标是将IoU扩展到overlap为0的情况下也可以进行优化，同时指出GIoU既可以用作损失函数，又可以用作一种度量，并通过实验证明了相比于传统的使用distance function回归bounding box参数以及IoU Loss上存在的优势。

（四）Problem Statement

由于目标检查任务使用的度量为IoU，而目前大多数的工作是使用bounding box的属性(x,y,w,h)结合distance loss function(Smooth L1,L2,L1)来进行的回归，作者指出使用上述的回归方式和真正的IoU之间并没有存在着较强的相关性，因此，作者借助The optimal objective for a metric is the metric itself的思想将IoU作为目标函数。

不过作者指出使用IoU作为目标函数，存在着bounding boxes不相交时无法进行优化的问题，因此，作者将IoU的概念进行扩展到bounding box不重叠的情况下，

作者指出，在进行扩展时需要满足的3个条件：

首先要和IoU具有相同的定义，也就是需要将被比较的两个boxes的形状属性(宽，高以及位置)等编码到区域属性(region property)上
需要保留IoU的尺度不变性
在bounding box重叠情况下，保持和IoU之间的强相关性

因此，本文的目的在于，如何引入一个和IoU具有强相关性的损失函数，并且不会存在IoU在bounding box不重叠时无法进行优化的问题?。

（五）Method

5.1 GIoU

在这里插入图片描述
对于两个任意的convex shapes $\subseteq \mathbb{S} \in \mathbb{R}^{n}$ ,首先找到包含 $A$ 和 $B$ 的两个最小凸集 $\subseteq \mathbb{S} \in \mathbb{R}^{n}$

关于C的说明说下：当比较两个特定类型的几何形状时，C可以来自同一个类型，也就是说对于两个任意椭球，C可以是包围它们的最小椭球

我们计算 $C$ (不包括A和B)占据的体积(面积)除以C占据的总体积(面积)之间的比率。然后从IoU值中减去该比率来获得GIoU。如上图所示。

并且GIoU满足之前所提到的度量的所有性质，并且GIoU是IoU的一个下界：

$\forall A, B \subseteq \mathbb{S}, \operatorname{GIoU}(A, B) \leq \operatorname{IoU}(A, B)$ ，并且当A和B的形状和位置非常接近时，GIoU的值将无限逼近IoU的值， $\lim _{A \rightarrow B} \operatorname{GIoU}(A, B)=\operatorname{IoU}(A, B)$
我们知道 $\forall A, B \subseteq \mathbb{S},0 \leq \operatorname{IoU}(A, B) \leq 1$ ,而 $\forall A, B \subseteq \mathbb{S},-1 \leq \operatorname{GIoU}(A, B) \leq 1$ ,
当

最低0.47元/天解锁文章

不知道叫啥好一点

博客等级

码龄8年

131
原创

257
点赞

823
收藏

124
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

最新评论

Learning to Track with Object Permanence阅读笔记
laser_yusuru: 写的太好了，但是这个疑问就是说有没有大佬解决一下
MOTR: End-to-End Multiple-Object Tracking with TRansformer阅读笔记
坚持努力不放弃: 现在有GTs,track queries,detect queries。Track queries不需要使用bipartite matching进行匹配,follow the same assignment of previous frames(这里说的比较抽象，实际上应该是当前已有的track queries中在之前已经将gt的label给到这儿了，接只需要确定当前track queries中和gt id对应上的那个就是要track queries需要对应的gt，如果GTs中没有能够同track queries对应上的,则将当前的track queries设置成无效，应该是将该track query删除)，接着剩下的没有匹配上的就看成是detect queries，将detect queries同剩下的GTs做一次匈牙利匹配，也就是一一对应上。 ———————————————— 你好，你说的这段内容，我还是有些没看明白，我想分享一下我的见解，你看我说的是否是你表达的这个意思在经过编码器之后，提取了图像的特征，同时初始化了固定长度的检测查询，再加上上一帧的跟踪查询，一同输入到解码器，通过自注意力的查询交互，跟踪查询首先已经跟真实框匹配了，检测查询只会和剩下的真实框进行匹配最后输出跟踪查询，以及只有新生目标的检测查询这大概就是我的理解，你能再说说你的看法吗
Verilog刷题-10-Wire_dec
zzzzzzzzzzzzzzzzh: 下午学习了一下综合软件，这个题目用三条wire和两条wire综合出来的RTL网表是一样的。没有节约什么资源。
Verilog刷题-10-Wire_dec
zzzzzzzzzzzzzzzzh: 少写一个wire有少用资源吗，我记得有工具可以综合出来实际电路图，2个wire和3个wire应该没差吧，我还不会用综合工具，以上是我的猜测。
Gaussian Bounding Boxes and Probabilistic Intersection-over-Union for Object Detection阅读笔记
李小小.: 原论文中说了，训练到一半的时候切换到L1损失。For the experiments with our loss functions, we defined a default setup where we start training with L2 loss for half of the total iterations, and then switch to L1.

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。