【有向目标检测】CSL环形平滑标签


论文地址: https://arxiv.org/abs/2003.05597v2
代码地址: https://github.com/open-mmlab/mmrotate
参考: https://zhuanlan.zhihu.com/p/111493759

1. 动机

1.1边界问题

目前流行的基于回归方式的角度预测方法或多或少都有边界问题,主要原因是理想的预测结果超出所定义的范围,导致产生一个较大的损失值。CSL通过将角度的回归问题转换成了一个分类问题,限制预测结果的范围来消除这一问题。

1.2现有分类编码局限性

简单的独热编码分类手段来处理存在几个问题:

  1. 表示方法需要采用五参数的形式,而且角度是要180角度范围的(长边定义法),不然依然回存在边的交换性问题(EoE)
  2. 目前的分类损失无法衡量预测结果和标签之间的角度距离,如图,如果 g t gt gt是0度,预测1度和-90度损失值是一样的。

请添加图片描述

2.CSL(Circular Smooth Label, CSL)

2.1.误差分析

回归问题转换成分类问题是一个连续到离散的问题,在这个转换的过程中会有精度的损失,比如在一度一类的情况下( w w w=1 ),无法预测出0.5度这种结果。

因此,需要先计算一下精度最大损失和平均损失(服从均匀分布),以确定这种损失对最后的结果影响大不大。

请添加图片描述

以一度一类的为例( w w w=1 ),精度最大和期望的损失分别是0.5和0.25。假如,有两个相同的长宽比1:9的同中心的矩形,角度相差0.5和0.25,则他们之间的IoU只下降了0.05和0.02。

2.2CSL编码

针对独热编码的局限性,CSL编码通过设置窗口函数,来衡量预测值和GT之间的角度距离,即在一定范围内,越靠近真实值的预测值的损失值越小,并且引入周期性解决角度周期性问题,使得89和-90两个角度变成近邻。

请添加图片描述

CSL表达式:

请添加图片描述

窗口函数性质:

  • 周期性

请添加图片描述

  • 对称性

请添加图片描述

  • 最大值

请添加图片描述

  • 单调性

请添加图片描述

注意:当窗口函数窗口半径很小时,CSL等价于One-hot label。

3.3检测模型:

请添加图片描述

以RetinaNet为Baseline,将角度作为180分类分支。

  • 回归框编码 (DeltaXYWHTRBBoxCoder)

请添加图片描述

  • 多任务损失函数

请添加图片描述

其中N表示anchor的数量, o b j n obj_{n} objn是一个二进制值( o b j n = 1 obj_{n}=1 objn=1表示前景, o b j n = 0 obj_{n}=0 objn=0表示背景,背景不回归)。 v ∗ j ‘ v^`_{*j} vj表示预测的偏移向量, v ∗ j v_{*j} vj 是 GT的目标向量。 θ n θ_n θn, θ n ‘ θ_n^‘ θn分别表示角度的标签和预测。 t n t_n tn表示对象的标签, P n P_n Pn是通过Sigmoid函数计算的各个类别的概率分布。 超参数 λ1、λ2、λ3 控制权衡,默认设置为 {1, 0.5, 1}。 分类损失 L c l s L_{cls} Lcls 和$ L_{CSL}$ 是Focal Loss或 sigmoid CE Loss,取决于检测器。 回归损失 L r e g L_{reg} Lreg 是Smooth L1 Loss。

注:角度有两个损失,回归以及分类损失都有。

3.实验结果

3.1.窗口函数
  • 由于EoE问题的存在, 90-CSL-baesd方法总体不如 180-CSL-baesd方法;
  • 基于高斯窗口函数的方法效果最好,而基于脉冲窗口函数(One-hot label)的效果最差,几乎预测不出角度值;
3.2.窗口半径
  • 窗口半径的大小要适中,过小则会变成One-hot label形式,无法学到角度信息,过大则角度预测偏差会加大;
  • 单阶段检测器比双阶段检测器对于窗口半径更加敏感,推测的原因是双阶段方法是基于instance-level的特征提取方法(RoI Pooling或RoI Align),这些方法提取到的特征会明显好于单阶段image-level的提取方式,使得双阶段检测方法可以区分更加小角度差的角度类别。

4.局限性

角度类别太多,会导致RetinaNet的head部分过于厚

  • 26
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
Zotero CSL(Citation Style Language)是一个开源的、零配置的引用风格样式表语言。它是用于Zotero等引文管理软件的引文风格的标准化语言。Zotero是一个免费的引文管理工具,旨在帮助学者和研究人员轻松管理他们的研究文献和引文。 使用Zotero CSL,用户可以方便地根据特定的学术引文要求创建和编辑引文风格。这些风格可以包括学术期刊的引文要求、出版商的指导方针和特定领域的引文规范等。用户可以选择已经存在的引文风格,也可以根据需要自定义新的引文风格。 Zotero CSL借助于XML语言来描述引文风格。用户可以使用XML编写具体的引文格式,包括作者、标题、出版日期等等。另外,用户还可以通过使用条件语句、循环语句等来实现更复杂的引文格式要求。这些XML文件可以与Zotero和其他引文管理软件一起使用,以确保生成符合学术期刊或指导方针要求的引文。 除了提供标准的引文风格,Zotero CSL还具有自动更新的功能。一旦某个学术期刊或指导方针发布了新的引文要求,用户可以更新相应的CSL文件,以适应最新的引文规范。这样,用户就无需手动更改每个引文的格式,而是可以通过简单的更新方法自动应用新的引文风格。 总而言之,Zotero CSL提供了一个简单、强大和灵活的引文风格管理工具,可以帮助用户轻松地满足不同学术期刊或指导方针对引文格式的要求。同时,它还具有自动更新的特性,以确保用户始终使用最新的引文规范。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值