giou--box回归两个坐标好还是回归中心点和宽高好?

最新推荐文章于 2024-05-30 11:24:50 发布

wanghua609

最新推荐文章于 2024-05-30 11:24:50 发布

阅读量513

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_38145317/article/details/100878988

版权

giou的文献是CVPR2019 论文《Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression》,可参考

https://arxiv.org/abs/1902.09630

目前,在目标检测领域,有的学者直接回归了box的左上(xmin,ymin)和右下(xmax,ymax)的坐标,有的是回归一个box的中心点和宽,高,那么,这两种方式到底哪个会好一些呢?

先来看,

目前目标检测中,主流的边界框优化采用的都是BBOX的回归损失(mse loss, L1-smooth loss等),这些方式计算损失值的方式都是检测得"代理属性"-距离,而忽略了检测框本身最显著的性质--iou.如下图所示,

黑色框代表预测框,绿色框代表真实标注,假设预测框的两个顶点分别在以绿框的左上和右下顶点为圆心的圆周上.两个框的左上和右下顶点坐标分别为

$y_{true}:(x_1,y_1,x_2,y_2),~~~y_{pred}:(\hat{x}_1,\hat{y}_1,\hat{x}_2,\hat{y}_2)$

所以由L2范数构造的损失值为

$loss=\sqrt{(x_1-\hat{x}_1)^2+(y_1-\hat{y}_1)^2+(x_2-\hat{x}_2)^2+(y_2-\hat{y}_2)^2}$

以giou论文中的图来说明

因为圆的半径相等,所以三个图的损失值

$loss=\sqrt{r_1^2+r_2^2}$

是相等的,但从图(a)可以看出,明显第一种情况iou较小,效果不好,说明在L2范数取到相同的值时,实际上检测效果确是差异巨大的,直接表现就是预测和真实检测框的iou值变化较大,这说明以L2范数来直接回归左上和右下坐标(x1,y1,x2,y2)的效果不是特别理想.

问题:

1. 我们网络回归的目的是loss比较小,当然在loss比较大的时候会出现上图的情况,但训练到最后,loss小的时候,iou都比较大了,也就不存在上图的情况了,所以基于上图来做改进,不会影响最终的模型的检测效果吧?

待解决,2019-9-17

再来看下回归一个box的中心点和宽,高,但这里会有正则化问题,因为中心点是在位置空间,而宽高(w,h)属于大小空间.

从图上直观理解,用iou来刻画损失值可能会更好些,但实际上为什么没有采用iou呢?这是由于iou有两个缺点,导致其不太适合做损失函数.

(1)若预测框y_pred与真实值y_true即ground truth(gt)之间没有重合时,iou为0,反映在损失函数,就是loss=0,意味着无法优化

2)在检测框与gt之间iou相同时,检测的效果也有很大差异,如下图所示

基于iou的优良特性和其作为损失函数时的致命缺点,作者提出了一个新的概念,giou,具体的需要看下论文.

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

wanghua609 CSDN认证博客专家 CSDN认证企业博客

码龄8年

421: 原创

2万+: 周排名

76万+: 总排名

226万+: 访问

: 等级

1万+: 积分

342: 粉丝

1641: 获赞

230: 评论

5634: 收藏

私信

关注

热门文章

最新评论

向日葵远程控制linux/window安装
joseph1314520: 还有Linux版本10.0的安装包吗
python 字典defaultdict(list)
満湫: [code=python] result = {} for (key, value) in data: if key not in result: result[key] = [] result[key].append(value) [/code] 以小弟的拙见。第一个方法感觉可以改成，先判断键在不在这个result里，如果不在，就在这个键对应位置创一个空列表，用来装那些数据。防止报错
python 字典defaultdict(list)
満湫: Traceback (most recent call last): File "D:\Work_APP\Anconda\envs\motionbert\lib\site-packages\IPython\core\interactiveshell.py", line 3457, in run_code exec(code_obj, self.user_global_ns, self.user_ns) File "<ipython-input-31-a115a0c08eff>", line 3, in <module> result[key].append(value) AttributeError: 'int' object has no attribute 'append'
python 字典defaultdict(list)
満湫: 第一个方法不太行呀
向日葵远程控制linux/window安装
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加除了各种控件外，文章正文的字数；(2)提升标题与正文的相关性；(3)增加条理清晰的目录。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。