遥感影像-语义分割数据集：耕地地块数据集详细介绍及训练样本处理流程

GIS潮流

于 2024-10-01 09:00:00 发布

阅读量363

点赞数 6

文章标签：遥感耕地数据集语义分割数据集

本文链接：https://blog.csdn.net/qq_34578459/article/details/142655943

版权

原始数据集详情

简介：该耕地地块数据集为吉林一号高分辨率卫星遥感影像，影像为四通道数据（B,G,R,NIR），分辨率为0.75~1.1米之间，训练集16张，测试集15张，行数与列数≥5000。

Key	Value
卫星类型	吉林一号
覆盖区域	未知
场景	未知
分辨率	0.75~1.1米
数量	训练集16张，测试集15张
单张尺寸	10000*8000左右
原始影像位深	8位
标签图片位深	8位
原始影像通道数	四通道数据（B,G,R,NIR）
标签图片通道数	单通道

标签类别对照表

像素值	类别名（英文）	类别名（中文）	RGB
0	background	背景	0,0,0
1	cultivatedland	耕地区域	255,0,0

彩色表添加

大家是否有这样的困惑？真值标签图片的像素值太小，比如1、2、3······，由于像素值太小，导致看上去标签图片全为黑色，无法看出真值标签与影像图片的像素位置是否对应？如果真值标签的像素值间隔太大，又无法直接作为训练样本。

其实有办法可以解决这个问题，那就是在像素值为1、2、3等的图片上添加一个彩色表，添加的彩色表不会改变标签图片的像素值，但是会有彩色的视觉效果，如下图所示：

在这里插入图片描述

数据预处理

下面对原始影像及标签进行模型训练前的数据预处理，根据这套数据集的原始信息，原始数据包括原始影像和RGB真值图片，需要将RGB波段转化为单波段图片，然后根据自己训练模型的图片尺寸大小使用代码批量裁剪原始影像和标签为所需要的尺寸，比如512*512，另外如果需要检查裁剪后的数据是否一一对应，最好给标签数据添加彩色表，这样就可以轻易看出影像和真值标签是否一致了。

最后可以直接用于训练的数据集结构如下所示：

├── train
│   ├── images
│   │   ├── 2522_0_0.tif
│   │   ├── 2522_0_512.tif
│   │   └── ......
│   └── labels
│       ├── 2522_0_0.tif
│       ├── 2522_0_512.tif
│       └── ......
└── val
    ├── images
    │   ├── 2522_512_512.tif
    │   ├── 2523_0_0.tif
    │   └── ......
    └── labels
        ├── 2522_512_512.tif
        ├── 2523_0_0.tif
        └── ......