数据集
Cityscapes
Cityscapes是一个语义分割数据集,包括2975张训练图片、500张验证图片5和1525张测试图,每张图片大小都是1024x2048。每张图片都有像素级的标注,经过转换后,可以用于目标检测任务。该数据集都是正常天气下不同城市的市区场景,目标物体主要是行人、车辆等。
例如:
Foggy Cityscapes
Foggy Cityscapes是在Cityscapes数据集基础上添加人工合成的雾制作而成,因而标注信息和原Cityscapes数据集完全相同。
例如:
SIM10k
SIM10k数据集是通过Grand Theft Auto V (GTA5)游戏引擎合成的人造数据集,包含10000张图片
例如:
KITTI
KITTI是一个自动驾驶数据集,包含7,481张训练图像。主要场景是一个中型城市的不同街道
例如:
PASCAL VOC
PASCAL VOC数据集是采集自真实世界的数据集,可用于检测和分割。对于检测任务,主要包括20个类别
例如:
Clipart and Watercolor
Clipart 和 Watercolor是人工制作的艺术型图像。Clipart 包含 1000张图像,总共20种类别。Watercolor 有2000张图片,共6种类别。
例如:
常见跨域组合
气候场景的域偏移
同样的场景和目标物体,不同的气候环境会造成巨大的域偏移。
Normal-to-Foggy
source:Cityscapes
target:FoggyCityscapes
真实图像和合成图像域偏移
人工合成图像一般来源于游戏引擎或者图像引擎,生成的时候就拥有精准的标注信息,几乎没有标注成本。但是合成图像和真实场景的图像之间有很大的域偏移。
Synthetic-to-Real
source:SIM10k
target:Cityscapes
不同角度和设备的域偏移
在真实场景下,通过不同角度或不同相机设备采集的图像之间可能也存在很大的域偏移。
source:Cityscapes
target:KITTI
大差别图像的域偏移
人工制作的艺术图像和真实图像有着巨大差别,会带来很严重的域偏移
source:Pascal VOC
target:Clipart