LVIS 数据集

最新推荐文章于 2025-02-06 15:45:26 发布

一颗仙桃儿

最新推荐文章于 2025-02-06 15:45:26 发布

阅读量6.6k

点赞数

分类专栏：数据不均衡&长尾学习文章标签：深度学习人工智能 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40310050/article/details/125666364

版权

LVIS是一个针对实例分割的大型数据集，包含超过1000个类别，旨在推动低镜头学习的研究。相比COCO，LVIS的类别分布更广，对象更小，且具有长尾特性。版本v0.5包含82k个注释图像，提供了丰富的训练和测试数据，用于2019年ICCV的挑战赛。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

数据集分析

为了进行分析，我们使用建议的管道对5000个图像（Coco Val2017拆分）进行了两次注释。我们首先讨论一般的数据集统计，然后在§4.2中对注释一致性进行分析，在§4.3中对评估协议进行分析。

4.1.数据集统计

类别统计。 5000 张 LVIS 图像中有 977 个类别。类别增长率（见图 9）表明最终数据集将有超过 1000 个类别。平均而言，每张图像都有来自 3.4 个类别的 11.2 个实例进行注释。每个图像的最大实例数是惊人的 294。图 6a 显示了每个图像的完整类别分布。 LVIS 的分布比 COCO 的分布更广，这表明许多图像标记了更多类别。我们的数据集的尾类性质可以在图 6b 中看到，它绘制了每个类别的实例总数（在 5000 张图像中）。中值是 9，虽然这个数字对于整个图像集会更大，但这个统计数据突出了我们数据具有挑战性的长尾特性。
在这里插入图片描述

在这里插入图片描述
比例统计。LVIS中的对象也更可能是小的。图6c显示了对象掩码的相对大小分布：与COCO相比，LVIS对象趋向于更小，并且大对象更少（例如，占据图像大部分的对象是∼10×更少的频率）。ADE20K总体上具有最少的大型对象，而具有更多的

最低0.47元/天解锁文章

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。