原始数据集详情
iSAID是第一个用于航空图像分割的基准数据集。这个大规模且注释密集的数据集包含2806张高分辨率图像中15个类别的655451个对象实例。iSAID的显著特征如下:(a)具有高空间分辨率的大量图像,(b)15个重要且常见的类别,(c)每个类别有大量实例,(d)每个图像有大量标记实例,这可能有助于学习上下文信息,(e)巨大的对象尺度变化,包含小、中、大对象,通常在同一幅图像中,(f)图像中具有不同方向的物体分布不平衡且不均匀,描绘了现实生活中的空中条件,(g)几个外观模糊的小尺寸物体只能通过上下文推理来解决,(h)由专业注释者进行精确的实例级注释,由符合明确定义的指南的专家注释器进行交叉检查和验证。
Key | Value |
---|---|
卫星类型 | 未知 |
覆盖区域 | 不确定 |
场景 | 城市 |
分辨率 | 未知(高分辨率) |
数量 | 训练集:1411,验证集:458 |
单张尺寸 | 不固定 |
原始影像位深 | 8位 |
标签图片位深 | 8位 |
原始影像通道数 | 三通道 |
标签图片通道数 | 三通道 |
官网 | https://captain-whu.github.io/iSAID/dataset.html |
标签类别对照表
像素值 | 类别名(英文) | 类别名(中文) | RGB |
---|---|---|---|
1 | ship | 船舶 | 0, 0, 63 |
2 | storage tank | 储罐 | 0, 63, 63 |
3 | baseball diamond | 棒球场 | 0, 63, 0 |
4 | tennis court | 网球场 | 0, 63, 127 |
5 | basketball court | 篮球场 | 0, 63, 191 |
6 | ground track field | 田径场 | 0, 63, 255 |
7 | bridge | 桥梁 | 0, 127, 63 |
8 | large vehicle | 大型车辆 | 0, 127, 127 |
9 | small vehicle | 小型车辆 | 0, 0, 127 |
10 | helicopter | 直升机 | 0, 0, 191 |
11 | swimming pool | 游泳池 | 0, 0, 255 |
12 | roundabout | 环岛 | 0, 191, 127 |
13 | soccer ball field | 足球场 | 0, 127, 191 |
14 | plane | 飞机 | 0, 127, 255 |
15 | harbor | 港口 | 0, 100, 155 |
数据处理部分
大家是否有这样的困惑,真值标签图片的像素值太小,比如1、2、3······,由于像素值太小,导致看上去标签图片全为黑色,无法看出真值标签与影像图片的像素位置是否对应?如果真值标签的像素值间隔太大,又无法直接作为训练样本。
其实有办法可以解决这个问题,那就是在像素值为1、2、3等的图片上添加一个彩色表,添加的彩色表不会改变图片的像素值,但是可以由彩色的视觉效果展示,如下图所示:
下面我们就对原始影像及标签进行模型训练前的数据预处理,根据这套数据集的原始信息,原作者整理的已基本接近训练条件,现在需要做的是根据自己训练模型的图片尺寸大小批量裁剪原始影像和标签为所需要的尺寸,比如512*512,另外如果需要检查裁剪后的数据是否一一对应,最好给标签数据添加颜色表,这样就可以轻易看出影像和真值标签是否一致。
下面就是使用代码对原始影像及原始标签进行批量裁剪为512*512大小,并给真值标签添加颜色表,效果图如下所示:
最后可以直接用于训练的数据集结构如下所示
/path/to/LoveDA
├── train
│ ├── images
│ │ ├── 2522_0_0.tif
│ │ ├── 2522_0_512.tif
│ │ └── ......
│ └── labels
│ ├── 2522_0_0.tif
│ ├── 2522_0_512.tif
│ └── ......
└── val
├── images
│ ├── 2522_512_512.tif
│ ├── 2523_0_0.tif
│ └── ......
└── labels
├── 2522_512_512.tif
├── 2523_0_0.tif
└── ......
相关数据和代码见 个人主页 技术交流輑
01、官网原始数据集;
02、中间处理好的数据集;
03、裁剪后可训练的数据集;
04、裁剪影像及添加颜色表代码;