遥感影像-语义分割数据集:iSAID数据集详细介绍及训练样本处理流程

原始数据集详情

iSAID是第一个用于航空图像分割的基准数据集。这个大规模且注释密集的数据集包含2806张高分辨率图像中15个类别的655451个对象实例。iSAID的显著特征如下:(a)具有高空间分辨率的大量图像,(b)15个重要且常见的类别,(c)每个类别有大量实例,(d)每个图像有大量标记实例,这可能有助于学习上下文信息,(e)巨大的对象尺度变化,包含小、中、大对象,通常在同一幅图像中,(f)图像中具有不同方向的物体分布不平衡且不均匀,描绘了现实生活中的空中条件,(g)几个外观模糊的小尺寸物体只能通过上下文推理来解决,(h)由专业注释者进行精确的实例级注释,由符合明确定义的指南的专家注释器进行交叉检查和验证。

KeyValue
卫星类型未知
覆盖区域不确定
场景城市
分辨率未知(高分辨率)
数量训练集:1411,验证集:458
单张尺寸不固定
原始影像位深8位
标签图片位深8位
原始影像通道数三通道
标签图片通道数三通道
官网https://captain-whu.github.io/iSAID/dataset.html

标签类别对照表

像素值类别名(英文)类别名(中文)RGB
1ship船舶0, 0, 63
2storage tank储罐0, 63, 63
3baseball diamond棒球场0, 63, 0
4tennis court网球场0, 63, 127
5basketball court篮球场0, 63, 191
6ground track field田径场0, 63, 255
7bridge桥梁0, 127, 63
8large vehicle大型车辆0, 127, 127
9small vehicle小型车辆0, 0, 127
10helicopter直升机0, 0, 191
11swimming pool游泳池0, 0, 255
12roundabout环岛0, 191, 127
13soccer ball field足球场0, 127, 191
14plane飞机0, 127, 255
15harbor港口0, 100, 155

数据处理部分

大家是否有这样的困惑,真值标签图片的像素值太小,比如1、2、3······,由于像素值太小,导致看上去标签图片全为黑色,无法看出真值标签与影像图片的像素位置是否对应?如果真值标签的像素值间隔太大,又无法直接作为训练样本。

其实有办法可以解决这个问题,那就是在像素值为1、2、3等的图片上添加一个彩色表,添加的彩色表不会改变图片的像素值,但是可以由彩色的视觉效果展示,如下图所示:
在这里插入图片描述

下面我们就对原始影像及标签进行模型训练前的数据预处理,根据这套数据集的原始信息,原作者整理的已基本接近训练条件,现在需要做的是根据自己训练模型的图片尺寸大小批量裁剪原始影像和标签为所需要的尺寸,比如512*512,另外如果需要检查裁剪后的数据是否一一对应,最好给标签数据添加颜色表,这样就可以轻易看出影像和真值标签是否一致。

下面就是使用代码对原始影像及原始标签进行批量裁剪为512*512大小,并给真值标签添加颜色表,效果图如下所示:

在这里插入图片描述

最后可以直接用于训练的数据集结构如下所示

/path/to/LoveDA
├── train
│   ├── images
│   │   ├── 2522_0_0.tif
│   │   ├── 2522_0_512.tif
│   │   └── ......
│   └── labels
│       ├── 2522_0_0.tif
│       ├── 2522_0_512.tif
│       └── ......
└── val
    ├── images
    │   ├── 2522_512_512.tif
    │   ├── 2523_0_0.tif
    │   └── ......
    └── labels
        ├── 2522_512_512.tif
        ├── 2523_0_0.tif
        └── ......

需要原始数据集、已处理数据、裁剪后可训练数据集的小伙伴可私信哦!

  • 25
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
iSaid数据集是一个常用的语音情感识别数据集,用于训练和评估语音情感识别模型。该数据集由三种情感类别的语音样本组成:愤怒、开心和中性。每个情感类别都包含来自不同说话人的语音样本。 要下载iSaid数据集,可以按照以下步骤进行: 1. 打开iSaid数据集的官方网站。可以在互联网上搜索"iSaid数据集"找到该网站。官方网站通常会提供数据集详细信息、下载链接和使用许可等信息。 2. 寻找适合您的需求的版本。根据您的要求,可能有多个版本的iSaid数据集可供下载。您可以根据数据集的大小、场景和语言等因素选择适合您的版本。 3. 点击下载链接。在官方网站上,您会找到一个下载链接。点击该链接,通常会弹出一个下载窗口或直接开始下载。如果下载没有自动开始,您可以右键点击链接并选择"保存链接"或"链接另存为"等选项。 4. 等待下载完成。下载速度取决于您的互联网连接速度和数据集的大小。请耐心等待下载完成。 5. 解压数据集文件。一旦下载完成,您会得到一个压缩文件。您可以使用常见的解压软件(如WinRAR、7-Zip等)来解压该文件。解压后,您将获得一个包含语音样本的文件夹。 6. 开始使用数据集。解压后的文件夹中应该包含语音样本的文件。您可以使用这些语音样本来训练和评估语音情感识别模型。 请注意,在下载和使用iSaid数据集时,请遵循数据集的许可和使用条款。这些条款通常在官方网站上提供。确保您了解使用数据集的限制和要求,并遵守相应的法律和道德准则。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值