ECCV 2020 实例分割挑战赛（LVIS Challenge）冠军方案

最新推荐文章于 2023-06-20 11:49:47 发布

CV-deeplearning

最新推荐文章于 2023-06-20 11:49:47 发布

阅读量1.1k

点赞数

分类专栏：实例分割竞赛文章标签：深度学习

本文链接：https://blog.csdn.net/Guo_Python/article/details/108711111

版权

实例分割竞赛专栏收录该内容

1 篇文章 0 订阅

订阅专栏

论文地址：https://arxiv.org/pdf/2009.01559.pdf

1. 作者与摘要

作者：作者分别来自同济大学、清华大学、商汤科技。

摘要：本文主要介绍冠军团队（LVIS Traveler）在2020实例分割挑战赛（LVIS Challenge 2020）上的解决方案。在比赛过程中，作者要兼顾LVIS数据集的两大特征：1.数据的长尾分布问题；2.高质量的实例分割掩码。作者采用两阶段的训练策略。第一阶段，即表示学习阶段，作者采用EQA和半监督学习技术来学习泛化的表示。在第二阶段，作者使用Balanced GroupSoftmax进行分类，提出了一种新的感兴趣区域分配策略和一种新的用来平衡掩码的损失函数，从而得到更加精确的掩码预测。最终：作者在LVIS数据集的验证集和测试机上分别取得了41.5AP和41.2AP的成绩，远远超越了X101-FPN-MaskRCNN的表现结果。

2. 总体介绍

LVIS是一个新的大规模实例分割数据集：数据集很大，类别多（1200+类别），各类别分布不平衡长尾效应明显，另外mask标注很精细（超过200万个高质量实例分割标注）。

作者的解决方案主要体现在两方面：1. 解决由于长尾分布引起的类间严重不均衡的问题；2.预测高质量的实例分割掩码。总体来说，作者采用了两阶段的训练策略，包括表示学习阶段和微调阶段。在表示学习阶段，作者用如下技术来学习到泛化的表示：EQL、repeat factor re-sampling、数据增强技术、自训练技术。在微调阶段，作者首先固定住主干网络的参数，然后用balanced group softmax技术去解决类间不均衡的问题。

在第二阶段，作者仍然将重点放在mask head的设计上。我们发现，较好的检测框并不能保证精确地分割掩码。例如：众多类别中有很多物体的mask与包围框的面积之比很小，很显然这多见于那些“细、长、瘦”的类别，他们包围框很大，mask占像素却不多（这也是论文标题中 “A Good Box is not a Guarantee of a Good Mask”的由来），其实应该使用精细的特征作为mask特征，所以不能仅根据尺度来确定分配FPN中那一层的特征。因此，我们提出了一种有效的平衡分割掩码的损失函数，它结合了dice loss和二值交叉熵损失。特别的，掩码损失函数的权重是根据面积比例（掩码的面积与框面积的比值）进行动态变化的。