遥感影像-语义分割数据集:2022年山东土地集团杯数据集详细介绍及训练样本处理流程

文章讲述了使用GF1-WFV卫星在山东滨州采集的遥感数据,针对土地利用类型的分类任务进行预处理,包括正射校正、配准和裁剪。解决真值标签像素值过小的问题,通过添加彩色表提高可视化效果。最后提供了预处理和裁剪后的数据集结构以及处理代码示例。
摘要由CSDN通过智能技术生成

原始数据集详情

简介:遥感数据为GF1-WFV拍摄的山东滨州附近地区的影像,预处理过程为正射校正、配准、裁剪。分类目标是山东省土地利用类型,经过处理合并得到以下六类:耕地、林地、草地、水域、城乡、工矿、居民用地及未利用土地。

KeyValue
卫星类型GF1-WFV
覆盖区域山东滨州附近地区
场景未知
分辨率16m
数量5000张
单张尺寸256*256
原始影像位深16位
标签图片位深8位
原始影像通道数三通道
标签图片通道数单通道

标签类别对照表

像素值类别名(英文)类别名(中文)RGB
0背景
1耕地
2林地
3草地
4水域
5城乡、工矿、居民用地
6未利用土地

数据处理部分

大家是否有这样的困惑?真值标签图片的像素值太小,比如1、2、3······,由于像素值太小,导致看上去标签图片全为黑色,无法看出真值标签与影像图片的像素位置是否对应?如果真值标签的像素值间隔太大,又无法直接作为训练样本。

其实有办法可以解决这个问题,那就是在像素值为1、2、3等的图片上添加一个彩色表,添加的彩色表不会改变图片的像素值,但是可以由彩色的视觉效果展示,如下图所示:
在这里插入图片描述

下面对原始影像及标签进行模型训练前的数据预处理,根据这套数据集的原始信息,原作者整理的已基本接近训练条件,现在需要做的是根据自己训练模型的图片尺寸大小批量裁剪原始影像和标签为所需要的尺寸,比如512*512,另外如果需要检查裁剪后的数据是否一一对应,最好给标签数据添加颜色表,这样就可以轻易看出影像和真值标签是否一致。

下面就是使用代码对原始影像及原始标签进行批量裁剪为256*256大小,并给真值标签添加颜色表,效果图如下所示:
在这里插入图片描述

最后可以直接用于训练的数据集结构如下所示


├── train
│   ├── images
│   │   ├── 2522_0_0.tif
│   │   ├── 2522_0_512.tif
│   │   └── ......
│   └── labels
│       ├── 2522_0_0.tif
│       ├── 2522_0_512.tif
│       └── ......
└── val
    ├── images
    │   ├── 2522_512_512.tif
    │   ├── 2523_0_0.tif
    │   └── ......
    └── labels
        ├── 2522_512_512.tif
        ├── 2523_0_0.tif
        └── ......

需要本博客相关数据和代码的小伙伴,可免费下载!!!
百度网盘链接
https://pan.baidu.com/s/15FdbOC7VqkZEn34y4nozkA?pwd=hs25
为防止链接失效,建议转存后再下载,网盘文件说明如下:
01、官网原始数据集;
02、中间处理好的数据集
03、裁剪后可训练的数据集;

  • 9
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值