遥感影像-语义分割数据集:2020年昇腾杯复赛数据集详细介绍及训练样本处理流程

原始数据集详情

简介:该数据集为2020年华为举办的昇腾杯其中一个赛道,依据现有的遥感地物分类要求,结合现有的地物分类实际需求,参照地理国情监测、“三调”等既有地物分类标准,依据遥感地物“所见即所得”原则,设计地物要素分类体系,共涉及二级子类17种。

KeyValue
卫星类型高分一、二、六号,高景二号,北京二号,以及部分航空等数据源的可见光、多光谱载荷图像
覆盖区域未知
场景未知
分辨率0.1米-4米
数量100000张
单张尺寸256*256
原始影像位深8位
标签图片位深8位
原始影像通道数三通道
标签图片通道数单通道

标签类别对照表

像素值类别名(英文)类别名(中文)
1water水体
2road道路
3building建筑
4airport机场
5railway station火车站
6photovoltaic光伏
7parking lot停车场
8playground操场
9cultivated land普通耕地
10agricultural greenhouse农业大棚
11natural grass自然草地
12unnatural grass绿地绿化
13natural forest自然林
14unnatural forest人工林
15natural bare soil自然裸土
16unnatural bare soil人为裸土
17other其他

数据处理部分

大家是否有这样的困惑,真值标签图片的像素值太小,比如1、2、3······,由于像素值太小,导致看上去标签图片全为黑色,无法看出真值标签与影像图片的像素位置是否对应?如果真值标签的像素值间隔太大,又无法直接作为训练样本。

其实有办法可以解决这个问题,那就是在像素值为1、2、3等的图片上添加一个彩色表,添加的彩色表不会改变图片的像素值,但是可以由彩色的视觉效果展示,如下图所示:

在这里插入图片描述

下面对原始影像及标签进行模型训练前的数据预处理,根据这套数据集的原始信息,原作者整理的已基本接近训练条件,现在需要做的是根据自己训练模型的图片尺寸大小批量裁剪原始影像和标签为所需要的尺寸,比如512*512,另外如果需要检查裁剪后的数据是否一一对应,最好给标签数据添加颜色表,这样就可以轻易看出影像和真值标签是否一致。

下面就是使用代码对原始影像及原始标签进行批量裁剪为512*512大小,并给真值标签添加颜色表,效果图如下所示:

在这里插入图片描述

最后可以直接用于训练的数据集结构如下所示

/path/to/LoveDA
├── train
│   ├── images
│   │   ├── 2522_0_0.tif
│   │   ├── 2522_0_512.tif
│   │   └── ......
│   └── labels
│       ├── 2522_0_0.tif
│       ├── 2522_0_512.tif
│       └── ......
└── val
    ├── images
    │   ├── 2522_512_512.tif
    │   ├── 2523_0_0.tif
    │   └── ......
    └── labels
        ├── 2522_512_512.tif
        ├── 2523_0_0.tif
        └── ......

需要本博客相关数据和代码的小伙伴,可免费下载!!!
百度网盘链接
https://pan.baidu.com/s/1bbulQeR4-JEzV9sVpOIENg?pwd=hs25
为防止链接失效,建议转存后再下载,网盘文件说明如下:
01、官网原始数据集;
02、中间处理好的数据集
03、裁剪后可训练的数据集;

  • 8
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值