概要
在图像分割领域,Cityscapes数据集是一个十分重要的数据集,主要包含城市街道场景的语义理解
常用下载
在Cityscaoes官网上下载数据集,但要先注册(使用教育邮箱或企业邮箱),下载界面如下:
目前语义分割算法中常用数据集文件是gtFine_trainvaltest.zipleftImg8bit_trainvaltest.zip (11GB)
原图存放在leftImg8bit文件夹中,精细标注的数据存放在gtFine 文件夹中
数据集结构
和绝大多数据集一样,包含train、val、test三个文件夹。其中,训练集(train)有2975张,验证集(val)有500张,对于测试集(test),官方只给出原图,没有给出相应精细标签,用于在官网上评估大家提交的代码。
值得再提的是gtFine文件中,每张原始图片都对应着4个文件:
(1)color.png:为了更好的可视化效果,将不同类别对应着不同色彩。
(2)instancelds.png:实例分割的结果。
(3)lablelds.png:取值范围[0-33],不同的值代表不同的类,在代码中cityscapesscripts/helpers/labels.py中定义了类别与值得对应关系。
(4)polygons.json:存储标注的数据(做过标注得应该了解,标注完一张图片后,会生成一个json文件,记录你标注点的所有坐标以及选择的何种类别)