《GIoU》论文笔记

论文链接:arxiv.org/abs/1902.09…

代码链接:github.com/generalized…

  这篇论文出自CVPR2019,算是目前已被录用且公布的为数不多的目标检测相关论文了。这篇论文提出了一种优化边界框的新方式——GIoU(generalized IoU,广义IoU)。目前关于IOU的新用法真是层出不穷,从Cascade R-CNNIOU Net再到如今的GIoU,GIoU的方法是这些论文中相对简单的,相信很多朋友了解了这篇文章的原理后,内心的OS都是“总觉得损失函数可以优化,这么简单我怎么没想到呢?”,哈哈,反正我是这样想的了。下面来看看这篇文章所提出的方法吧。

动机

  目前目标检测中主流的边界框优化采用的都是BBox的回归损失(MSE loss, L1-smooth loss等),这些方式计算损失值得方式都是检测框得“代理属性”——距离,而忽略了检测框本身最显著的性质——IoU。如下图所示,在L1及L2范数取到相同的值时,实际上检测效果却是差异巨大的,直接表现就是预测和真实检测框的IoU值变化较大,这说明L1和L2范数不能很好的反映检测效果。

  除了能反映预测检测框与真实检测框的检测效果外,IoU还具有尺度不变性。可是既然IOU这么好,为什么之前不直接用IoU呢,这是由于IoU有两个缺点,导致其不太适合做损失函数:

  • 但检测框与gt之间没有重合时,IoU为0。而在优化损失函数时,梯度为0,意味着无法优化
  • 在检测框与gt之间IoU相同时,检测的效果也具有较大差异,如下图所示:

  基于IoU的优良特性和其作为损失函数时的致命缺点,作者提出了一个新的概念——GIoU

方法

  GIoU的定义如下图所示,

  根据定义,GIoU具有如下性质:

  • GIoU具有作为一个度量标准的优良性质。包括非负性,同一性,对称性,以及三角不等式的性质
  • 与IoU相似,具有尺度不变性
  • GIoU的值总是小于IoU的值
  • 对于两个矩形框A和B,0≤IoU(A,B)≤1,而-1≤GIoU≤1
  • 在A,B没有良好对齐时,会导致C的面积增大,从而使GIoU的值变小,而两个矩形框不重合时,依然可以计算GIoU,一定程度上解决了IoU不适合作为损失函数的原因

  GIoU作为损失函数时计算方式如下的算法2

  从算法中可以看到和GIoU的计算方式和IoU的步骤基本保持一致,在得到IoU的值后在根据上面的算法1计算GIoU的值。这里还不太清楚方向传播时,梯度是怎么计算的。等我看看源码再来更新吧

实验

  作者分别在几种主流的目标检测算法上做了实验,分别是YoLo、Faster R-CNN和Mask R-CNN。这里贴上在Pascal Voc数据集上的实验结果,如下

  实验结果中在YoLo v3上可以看到GIoU相比IoU的损失函数有较大幅度的提升,而在faster r-cnn中GIoU和IoU作为损失函数的区别不大,这里作者给出的解释是faster rcnn的anchor更密集,导致不易出现与gt不重叠的检测框。其实个人认为,anchor多的情形与gt不重叠的检测框才多,更根本的原因应该是RPN网络进行了一次粗检后,滤去了大部分跟gt没有重合的检测框。导致GIoU相比IoU的损失函数提升不明显吧

总结

  GIoU的方法很简单,巧妙的是优化的点。通过广义IoU作为损失函数替代bbox回归还是很有趣的。不过疑惑的是实验结果中的检测AP值都非常低,原生的faster rcnn在pascal voc上的检测效果都不会这么差。从实验对比上GIoU的损失函数相比原始的损失函数在准确率不到40%的效果上来说确实有较大幅度的提升。然而要是换到准确率较高的baseline上呢?这一点还需要实验验证。   另外总感觉这篇论文有点点到即止,没有更多的实验验证bbox作为损失函数存在缺陷的原因。


欢迎关注我的公众号

转载于:https://juejin.im/post/5c8de448f265da67da2b0a2a

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值