文章目录
Pascal VOC数据集
Pascal VOC挑战赛,世界级的计算机视觉挑战赛,从2005年开始举办,比赛内容有分类object classification、检测object detection、分割object segmentation、人体布局human layout、动作识别action classification等。
数据集结构总共四个大类,20个小类:
- vehicle(aeroplane、bicycle、boat、bus、car、motorbike、train)
- household(bottle、chair、dining table、potted plant、sofa、tv/monitor)
- animal(bird、cat、cow、dog、horse、sheep)
- person
MSCOCO数据集
ImageNet竞赛停办后,COCO竞赛成为目前该领域唯一能汇集Google、微软、Facebook以及国内外众多顶尖院校和优秀创新企业共同参与的大赛。
其官方介绍:COCO是一个大规模的用于物体检测、分割和image captioning的数据集。
是目前为止有语义分割的最大数据集,提供的类别有80类,超过33万张图片,其中20万张有标注,整个数据集中个体的数目超过150万个。
有一篇论文专门描述Microsoft COCO数据集的。
BDD100K:A Large-scale Diverse Driving Video Database数据集
BDD100K是berkeley2018年发布的目前最大最丰富的驾驶数据集,包含10万段高清视频,每个视频约40秒,720p,30fps。每个视频的第十秒对关键帧进行采样,得到10万张图片(1280×710),并进行了标注。
(Lane Markings)
(Drivable Areas)
(Full-frame Segmentation)
Cityscapes数据集
Cityscapes是关于城市街道场景的语义理解图片数据集,采集于50个城市
- 30个类别
- 标注:5000张像素标注(pixel level);20000张多边形标注(instance level)
Mapillary Vistas Dataset
世界上最大最丰富的像素精确和特定实例标注的街道级图像公开数据集。其中包括25000张高分辨率的彩色图像,分成66个类,其中37个类别是特定的附加于实例的标签。