原始数据集详情
简介:细粒度语义分割赛道依据现有的遥感地物分类要求, 结合现有的地物分类实际需求,参照地理国情监测、 “三调”等既有地物分类标准,依据遥感地物“所见即所得”原则, 设计地物要素分类体系,共涉及二级子类(47类),数据为0.8米-2米分辨率的遥感图像。
Key | Value |
---|---|
卫星类型 | GaoFen-1、ZiYuan-3 |
覆盖区域 | 未知 |
场景 | 未知 |
分辨率 | 0.8m-2m |
数量 | 35000张 |
单张尺寸 | 512*512 |
原始影像位深 | 8位 |
标签图片位深 | 8位 |
原始影像通道数 | 四通道 |
标签图片通道数 | 单通道 |
标签类别对照表
像素值 | 类别名(中文) | 像素值 | 类别名(中文) |
---|---|---|---|
0 | 背景 | 24 | 公路 |
1 | 旱地 | 25 | 铁路 |
2 | 果园 | 26 | 硬化地表 |
3 | 茶园 | 27 | 水工设施 |
4 | 桑园 | 28 | 城墙 |
5 | 橡胶园 | 29 | 温室、大棚 |
6 | 苗圃 | 30 | 固化池 |
7 | 花圃 | 31 | 工业设施 |
8 | 其他经济苗木 | 32 | 沙障 |
9 | 乔木林 | 33 | 其他构筑物 |
10 | 灌木林 | 34 | 露天采掘场 |
11 | 乔灌混合林 | 35 | 堆放物 |
12 | 竹林 | 36 | 建筑工地 |
13 | 疏林 | 37 | 其他人工堆掘地 |
14 | 绿化林地 | 38 | 盐碱地表 |
15 | 人工幼林 | 39 | 泥土地表 |
16 | 稀疏灌草丛 | 40 | 沙质地表 |
17 | 天然草地 | 41 | 砾石地表 |
18 | 人工草地 | 42 | 岩石地表 |
19 | 多层及以上房屋建筑区 | 43 | 河渠 |
20 | 低矮房屋建筑区 | 44 | 水面 |
21 | 废弃房屋建筑区 | 45 | 冰川与常年积雪 |
22 | 多层及以上独立房屋建筑 | 46 | 水田 |
23 | 低矮独立房屋建筑 |
数据处理部分
大家是否有这样的困惑?真值标签图片的像素值太小,比如1、2、3······,由于像素值太小,导致看上去标签图片全为黑色,无法看出真值标签与影像图片的像素位置是否对应?如果真值标签的像素值间隔太大,又无法直接作为训练样本。
其实有办法可以解决这个问题,那就是在像素值为1、2、3等的图片上添加一个彩色表,添加的彩色表不会改变图片的像素值,但是可以由彩色的视觉效果展示,如下图所示:
下面对原始影像及标签进行模型训练前的数据预处理,根据这套数据集的原始信息,原作者整理的已基本接近训练条件,现在需要做的是根据自己训练模型的图片尺寸大小批量裁剪原始影像和标签为所需要的尺寸,比如512*512,另外如果需要检查裁剪后的数据是否一一对应,最好给标签数据添加颜色表,这样就可以轻易看出影像和真值标签是否一致。
下面就是使用代码对原始影像及原始标签进行批量裁剪为512*512大小,并给真值标签添加颜色表,效果图如下所示:
最后可以直接用于训练的数据集结构如下所示
├── train
│ ├── images
│ │ ├── 2522_0_0.tif
│ │ ├── 2522_0_512.tif
│ │ └── ......
│ └── labels
│ ├── 2522_0_0.tif
│ ├── 2522_0_512.tif
│ └── ......
└── val
├── images
│ ├── 2522_512_512.tif
│ ├── 2523_0_0.tif
│ └── ......
└── labels
├── 2522_512_512.tif
├── 2523_0_0.tif
└── ......
获取相关数据集或咨询交流见 博主首页 个人简介
1、官网原始数据集;
2、中间处理好的大图数据集;
3、裁剪后可直接训练的小图数据集;