数据集分析
为了进行分析,我们使用建议的管道对5000个图像(Coco Val2017拆分)进行了两次注释。 我们首先讨论一般的数据集统计,然后在§4.2中对注释一致性进行分析,在§4.3中对评估协议进行分析。
4.1.数据集统计
类别统计。 5000 张 LVIS 图像中有 977 个类别。类别增长率(见图 9)表明最终数据集将有超过 1000 个类别。平均而言,每张图像都有来自 3.4 个类别的 11.2 个实例进行注释。每个图像的最大实例数是惊人的 294。图 6a 显示了每个图像的完整类别分布。 LVIS 的分布比 COCO 的分布更广,这表明许多图像标记了更多类别。我们的数据集的尾类性质可以在图 6b 中看到,它绘制了每个类别的实例总数(在 5000 张图像中)。中值是 9,虽然这个数字对于整个图像集会更大,但这个统计数据突出了我们数据具有挑战性的长尾特性。
比例统计。LVIS中的对象也更可能是小的。图6c显示了对象掩码的相对大小分布:与COCO相比,LVIS对象趋向于更小,并且大对象更少(例如,占据图像大部分的对象是∼10×更少的频率)。ADE20K总体上具有最少的大型对象,而具有更多的