语义分割数据集说明(一)------Cityscapes,PASCAL VOC2012

语义分割数据集说明(一)------Cityscapes,PASCAL VOC2012


为了方便了解和使用,整理下数据集的说明,主要是语义分割部分。

1. Cityscapes

该数据集的说明可参见官网https://www.cityscapes-dataset.com/,或者https://github.com/mcordts/cityscapesScripts ,以及其他博客。下载该数据解压后,:
1)下载该数据解压后,具体的数据位置结构如下图所示:
在这里插入图片描述
该数据集包含精标数据5000份,图片数据存放在“leftImg8bit”目录下,训练集和验证集的语义ground truth放在“gtFine”目录下,其中
图片尺寸: 1024*2048
训练集: 2975, 验证集: 500, 测试集: 1525
总共类别数目为:包括未标注的0类,总共35类, 其中的labels说明如下图,参见labels.py

2)详细的35类标签如下如所示:

在这里插入图片描述注意到上图中“ignoreInEval”列含有16类在测试集上进行计算时需要忽略,所以总共有19类,关于语义分割任务。

2. PASCAL VOC 2012

PASCAL-VOC2012数据集说明可参见官网http://host.robots.ox.ac.uk/pascal/VOC/voc2012/index.html。注意在下载了训练和测试数据后,如下所示:
在这里插入图片描述
1)当解压三个tar文件之后,训练、验证、测试数据都放到了“VOCdevkit/VOC2012”目录下,如下图所示:
在这里插入图片描述

2)PASCAL VOC 2012总共有17125张图片数据,存放在解压后的“VOCdevkit/VOC2012/JPEGImages”目录下,用于不同的任务。注意到这些图片的尺寸大小不一,横向图片尺寸大约在375x500,纵向图片尺寸大约在500x375左右。但是基本偏差不超过100(可参考其他博客)。对于语义分割任务,这个数据含有20类(不包括背景类),具体类别如下:

  • Person: person
  • Animal: bird, cat, cow, dog, horse, sheep
  • Vehicle: aeroplane, bicycle, boat, bus, car, motorbike, train
  • Indoor: bottle, chair, dining table, potted plant, sofa, tv/monitor

但是“VOCdevkit/VOC2012/SegmentationClasses”下只有2913张语义分割labels图,即17125张图片中只有2913张图片用于语义分割任务。这2913张图片共同构成语义分割任务的训练集和验证集,具体如下:
训练集: 1464, 验证集: 1449,
而测试集有1456张图片。
这2913张语义分割任务对应的图片名字列表,存放在“VOCdevkit/VOC2012/ImageSets/Segmentation”下的“train.txt”, “val.txt”。

3)然后关于语义分割任务的训练集、验证集、测试集数据列表就在上图中的“ImageSets/Segmentation”下面。(注意这里的ImageSets下的每个目录相当于不同的任务,实则上不同的数据集列表,后面都加了后缀如“_train”, “_val”, "_test"用于区分训练、验证、测试数据)。

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值