文章目录
- 一、ModaNet
- 二、SKU110K
- 三、SceneNet
- 四、VT5000
- 五、Washington RGB-D
- 六、Argoverse-HD
- 七、CADC (Canadian Adverse Driving Conditions)
- 八、ELEVATER (Evaluation of Language-augmented Visual Task-level Transfer)
- 九、MALF (Multi-Attribute Labelled Faces)
- 十、TinyPerson
- 十一、UVO (Unidentified Video Objects: A Benchmark for Dense, Open-World Segmentation)
- 十二、EORSSD (Extended Optical Remote Sensing Saliency Detection)
- 十三、MSeg
- 十四、OpenImages-v6
- 十五、RADIATE (RAdar Dataset In Adverse weaThEr)
一、ModaNet
ModaNet 是一个街头时尚图像数据集,由与 RGB 图像相关的注释组成。 ModaNet 为每个图像提供多个多边形注释。 每个多边形都与 13 个元时尚类别的标签相关联。 注释基于 PaperDoll 图像集中的图像,该图像集中只有几百张由基于超像素的工具注释的图像。
二、SKU110K
Sku110k 数据集提供了 11,762 张图像,其中包含在密集场景中捕获的超过 170 万个带注释的边界框,其中包括 8,233 张用于训练的图像、588 张用于验证的图像以及 2,941 张用于测试的图像。 总共约有 1,733,678 个实例。 这些图像是从数千家超市商店收集的,具有不同的比例、视角、照明条件和噪音水平。 所有图像的大小都调整为一百万像素的分辨率。 数据集中的大多数实例都是紧密堆积的,并且通常具有 [−15∘, 15∘] 范围内的某个方向。
三、SceneNet
SceneNet 是带标签的合成室内场景的数据集。 有几个标记的室内场景,包括:
11 个卧室场景,包含 428 个物体
15 个办公室场景,包含 1,203 个对象
11 个厨房场景,包含 797 个物体
10 个客厅场景,包含 715 个物体
10 间浴室&