pytorch深度学习案例(二)——航拍街道语义分割

数据集

使用的数据集是kaggleSemantic segmentation of aerial imagery
其数据的组织形式为
在这里插入图片描述

项目结构

在这里插入图片描述

utils

dataConvert.py

dataConvert中主要包含数据的变换过程

函数作用
loadColorMap用于加载标签的颜色映射
voc_colormap2label获取颜色标签到数值标签的映射关系
voc_rand_crop用于裁剪数据
voc_label_indices将RGB标签转换成数值标签
one hot将标签转换成one hot

dataLoader.py

dataLoader.py包含数据的加载过程

类/函数作用
SemanticDataset数据加载类,包含数据归一化,数据裁剪过程,用于加载数据
load_data_voc调用SemanticDataset批量加载训练集和测试集

losses.py

定义损失函数,本项目中采用的是Focal loss和Dice loss相加作为损失函数

model.py

包含U-net模型和deeplabv3+两种模型,在训练和测试过程可以通过修改参数进行选择

prepare模块

这个模块在训练前执行,是整个项目的准备工作

函数

函数作用
semantic2dataset航拍数据集转换成语义分割的数据集
trainValSplit分割训练集和测试集
getMeanStd获取均值和方差
writeColorClasses保存颜色和类别

参数

参数只有两个,就是颜色映射和类别,在本项目中这两个参数为

VOC_COLORMAP = [[226, 169, 41], [132, 41, 246], [110, 193, 228], [60, 16, 152], [254, 221, 58], [155, 155, 155]]
VOC_CLASSES = ['Water', 'Land (unpaved area)', 'Road', 'Building', 'Vegetation', 'Unlabeled']

train模块

函数

train
根据传入的参数进行训练

参数

参数作用
batch_size批量大小,在语义分割中可以设置小一些
crop_size裁剪图像大小
model_choice模型的选择,可选U-net、deeplabv3+
in_channels输入图像通道数,RGB图像为3,灰度图为1
out_channels输出标签类别,本项目中为6
num_epochs训练总轮次
auto_save自动保存权值的间隔轮次
lr学习率
device训练使用的环境,当cuda可用时自动设为cuda,否则自动设为cpu

predict模块

predict模块只是浅测一下模型的精度和效果,如果需要应用可以调用predict函数进行预测并与实际应用结合

函数

函数作用
label2image数值标签转换成RGB标签
predict单张图片的预测
read_voc_images读取图片
plotPredictAns画出测试结果

参数

参数作用
voc_dir测试数据的路径
means图像均值
stds图像方差
device训练使用的环境,当cuda可用时自动设为cuda,否则自动设为cpu
batch_size批量大小
model_choice模型的选择,可选U-net、deeplabv3+

下载地址

GitHub下载地址:Semantic-segmentation-for-aerial

详细讲解

语义分割项目(一)——数据概况及预处理

语义分割项目(二)——标签转换与数据加载

语义分割项目(三)——语义分割模型(U-net和deeplavb3+)

语义分割项目(四)——模型训练与预测

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
街景语义分割是一种在街道场景中对图像进行像素级别分类的任务,其中建筑是其中的一个类别。通过对街景图像进行语义分割,可以将每个像素点分配到不同的语义类别中,包括建筑、道路、人行道、栅栏、植被、车辆等。在这个任务中,建筑的像素将被标记为建筑类别,以便在自动驾驶或城市场景规划等研究领域中进行场景理解。街景语义分割数据集如Cityscapes提供了对建筑等多个类别的像素级别标注,使得研究人员可以训练和评估模型在街景图像中提取建筑的能力。\[1\]\[2\]\[3\] #### 引用[.reference_title] - *1* *3* [街景语义分割数据集总结](https://blog.csdn.net/soulmeetliang/article/details/89880931)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down28v1,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [第十五章:DenseASPP for Semantic Segmentation in Street Scenes——在街景语义分割中的DenseASPP](https://blog.csdn.net/ADICDFHL/article/details/131750812)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down28v1,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

艾醒(AiXing-w)

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值