语义分割数据集说明（一）------Cityscapes，PASCAL VOC2012

最新推荐文章于 2024-05-29 17:21:35 发布

雁知返

最新推荐文章于 2024-05-29 17:21:35 发布

阅读量2.1k

点赞数 2

分类专栏：深度学习语义分割数据集介绍文章标签：深度学习机器学习计算机视觉

本文链接：https://blog.csdn.net/csuwoshikunge/article/details/104411554

版权

深度学习同时被 3 个专栏收录

7 篇文章 1 订阅

订阅专栏

语义分割

1 篇文章 0 订阅

订阅专栏

数据集介绍

1 篇文章 0 订阅

订阅专栏

语义分割数据集说明（一）------Cityscapes，PASCAL VOC2012

- - 1. Cityscapes
  - 2. PASCAL VOC 2012

为了方便了解和使用，整理下数据集的说明，主要是语义分割部分。

1. Cityscapes

该数据集的说明可参见官网https://www.cityscapes-dataset.com/，或者https://github.com/mcordts/cityscapesScripts ，以及其他博客。下载该数据解压后，：
1）下载该数据解压后，具体的数据位置结构如下图所示：
在这里插入图片描述
该数据集包含精标数据5000份,图片数据存放在“leftImg8bit”目录下，训练集和验证集的语义ground truth放在“gtFine”目录下，其中
图片尺寸： 1024*2048
训练集: 2975， 验证集: 500， 测试集: 1525
总共类别数目为：包括未标注的0类，总共35类, 其中的labels说明如下图，参见labels.py

2）详细的35类标签如下如所示：

在这里插入图片描述 注意到上图中“ignoreInEval”列含有16类在测试集上进行计算时需要忽略，所以总共有19类，关于语义分割任务。

2. PASCAL VOC 2012

PASCAL-VOC2012数据集说明可参见官网http://host.robots.ox.ac.uk/pascal/VOC/voc2012/index.html。注意在下载了训练和测试数据后，如下所示：
在这里插入图片描述
1）当解压三个tar文件之后，训练、验证、测试数据都放到了“VOCdevkit/VOC2012”目录下，如下图所示：

2）PASCAL VOC 2012总共有17125张图片数据，存放在解压后的“VOCdevkit/VOC2012/JPEGImages”目录下，用于不同的任务。注意到这些图片的尺寸大小不一，横向图片尺寸大约在375x500，纵向图片尺寸大约在500x375左右。但是基本偏差不超过100（可参考其他博客）。对于语义分割任务，这个数据含有20类（不包括背景类），具体类别如下：

Person: person
Animal: bird, cat, cow, dog, horse, sheep
Vehicle: aeroplane, bicycle, boat, bus, car, motorbike, train
Indoor: bottle, chair, dining table, potted plant, sofa, tv/monitor

但是“VOCdevkit/VOC2012/SegmentationClasses”下只有2913张语义分割labels图，即17125张图片中只有2913张图片用于语义分割任务。这2913张图片共同构成语义分割任务的训练集和验证集，具体如下：
训练集： 1464， 验证集： 1449，
而测试集有1456张图片。
这2913张语义分割任务对应的图片名字列表，存放在“VOCdevkit/VOC2012/ImageSets/Segmentation”下的“train.txt”, “val.txt”。

3）然后关于语义分割任务的训练集、验证集、测试集数据列表就在上图中的“ImageSets/Segmentation”下面。（注意这里的ImageSets下的每个目录相当于不同的任务，实则上不同的数据集列表，后面都加了后缀如“_train”, “_val”, "_test"用于区分训练、验证、测试数据）。

雁知返

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
语义分割数据集说明（一）------Cityscapes，PASCAL VOC2012

数据集使用说明1. Cityscapes2. PASCAL VOC 20121. Cityscapes该数据集包含精标数据5000份,图片数据存放在“leftImg8bit”目录下，语义ground truth放在“gtFine”目录下（gtFine/test下没有），其中图片尺寸： 1024*2048训练集: 2975，验证集: 500，测试集: 1525总共类别数目为：包括...
复制链接

扫一扫