文章目录
- 一、COCO (Microsoft Common Objects in Context)
- 二、Cityscapes
- 三、KITTI
- 四、ShapeNet
- 五、ScanNet
- 六、ADE20K
- 七、NYUv2 (NYU-Depth V2)
- 八、DAVIS (Densely Annotated VIdeo Segmentation)
- 九、SYNTHIA (SYNTHetic Collection of Imagery and Annotations)
- 十、SUN RGB-D
- 十一、S3DIS (Stanford 3D Indoor Scene Dataset (S3DIS))
- 十二、GTA5 (Grand Theft Auto 5)
- 十三、PASCAL VOC (PASCAL Visual Object Classes Challenge)
- 十四、EuroSAT
- 十五、BDD100K
一、COCO (Microsoft Common Objects in Context)
MS COCO(Microsoft Common Objects in Context)数据集是一个大规模的对象检测、分割、关键点检测和字幕数据集。 该数据集由 328K 图像组成。
分割:MS COCO 数据集的第一个版本于 2014 年发布。它包含 164K 图像,分为训练集 (83K)、验证集 (41K) 和测试集 (41K)。 2015年发布了额外的81K图像测试集,包括之前的所有测试图像和40K新图像。
根据社区反馈,2017 年训练/验证比例从 83K/41K 更改为 118K/5K。 新的分割使用相同的图像和注释。 2017 年测试集是 2015 年测试集 41K 图像的子集。 此外,2017 年版本还包含一个新的未注释的 123K 图像数据集。
注释:数据集有注释
对象检测:具有 80 个对象类别的边界框和每个实例分割掩模,
字幕:图像的自然语言描述(参见 MS COCO 字幕),
关键点检测:包含超过 200,000 张图像和 250,000 个用关键点标记的人物实例(17 个可能的关键点,例如左眼、鼻子、右臀部、右脚踝),
东西图像分
本文详细介绍了计算机视觉领域用于语义分割的多个数据集,包括COCO、Cityscapes、KITTI、ShapeNet等,涵盖了它们的特性、规模和应用场景。这些数据集在推动深度学习模型的发展和研究中起着至关重要的作用。
订阅专栏 解锁全文
692

被折叠的 条评论
为什么被折叠?



