深度学习:使用UNet做图像语义分割,训练自己制作的数据集并推理测试(详细图文教程)

语义分割(Semantic Segmentation)是图像处理和机器视觉一个重要分支。与分类任务不同,语义分割需要判断图像每个像素点的类别,进行精确分割。语义分割目前在自动驾驶、自动抠图、医疗影像等领域有着比较广泛的应用。我总结了使用UNet网络做图像语义分割的方法,教程很详细,学者耐心学习。

一、 源码包下载

配套教程的源码包,获取方法文章末扫码到公众号「视觉研坊」中回复关键字:语义分割UNet。获取下载链接。当然官网也给了源码包,官网下载链接为:官网。学者也可以下载官网提供的,建议学者直接下载我提供的学习,我已经补了一些坑,添加过一些实用代码。下载好我提供的源码包,解压后的样纸见下:

在这里插入图片描述

二、安装训练必要的库文件

Python的版本选用3.7或者3.8都可以。

在这里插入图片描述

三、 准备数据集

3.1 打标签

数据集的准备,看学者自己个人想要识别什么物体,自行准备即可。我提供的源码包中有我自己喷血已经打好标签的数据集,打标签需要用到的工具叫作labelme,关于labelme工具的具体使用教程,学者看我的另外一篇博客,链接为:Labelme使用教程

准备好的数据集先存放到工程文件夹下的datasets文件下,具体的文件存放位置关系见下:

在这里插入图片描述

3.2 复制数据集和标签文件到VOCdevkit文件中

通过上面步骤制作好标签文件后,将数据集和标签文件从datasets文件中复制一份到VOCdevkit文件中,具体见下:

在这里插入图片描述

在这里插入图片描述

3.3 提取训练集和验证集图片名称

代码中需要修改到的地方见下:

在这里插入图片描述

学者只要运行源码包中的voc_annotion.py文件后,就可以在 ./VOCdevkit/VOC2007/ImageSets/Segmentation目录下自动生成train.txt和val.txt文件,具体见下:

在这里插入图片描述

四、训练

4.1 训练参数的修改

下面有很多的参数可以修改,学者根据自己的训练情况进行修改即可,训练修改的参数都在train.py文件中,具体见下:

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

4.2 开始训练

上面的参数修改好后,直接运行train.py文件就开始训练了,见下:

在这里插入图片描述

在这里插入图片描述

五、模型测试

5.1 保存模型权重文件

上面的训练好后,模型都会被保存到工程文件夹根目录中的logs文件中,见下:

在这里插入图片描述

5.2 修改模型测试参数

测试模型时,需要修改到的地方见下:

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

学者在测试的时候,有三种模式可以选择,(1)测试图片;(2)测试电脑硬盘中的视频;(3)调用电脑自带摄像头测试。三种模式的选择,学者修改下面代码即可,见下:

在这里插入图片描述

5.3 模型推理测试

上面的模型测试参数修改好后,直接运行predict.py即可开始预测:

在这里插入图片描述

5.3.1 单帧图片测试

在这里插入图片描述

5.3.2 电脑硬盘中视频测试

在这里插入图片描述

5.3.3 调用电脑自带摄像头测试

在这里插入图片描述

六、总结

以上就是使用UNet做图像语义分割,自己打标签训练的详细教程,参数调整部分,学者根据需求自行调整,很多参数保持默认即可,参数name_classes的数量和类名一定要根据自己数据集修改。希望我总结的教程帮你快速上手使用。

总结不易,多多支持,谢谢!

  • 193
    点赞
  • 927
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 492
    评论
UNET是一种常用于语义分割任务的卷积神经网络模型。如果要使用UNET进行语义分割,并且使用自己的数据集,可以按照以下步骤进行: 1. 数据收集:首先,需要收集适合您任务的语义分割数据集。这可能包括图像和相应的标签。图像是原始图像,标签是与每个像素对应的正确的类别或分割掩模。 2. 数据预处理:对于UNET模型,通常需要将图像和标签调整为相同的大小。还可以进行其他预处理步骤,例如裁剪、旋转、对比度增强等,以增加数据集的多样性和鲁棒性。 3. 数据划分:将数据集划分为训练集、验证集和测试集。训练集用于训练UNET模型的参数,验证集用于调整模型的超参数和监控训练过程,测试集用于评估模型的性能。 4. 数据增强:使用数据增强技术来扩充训练集的大小。数据增强可以包括镜像翻转、平移、旋转、缩放等操作,以增加数据集的多样性,提高模型的泛化能力。 5. 模型训练使用训练集来训练UNET模型。训练过程中可以使用反向传播算法和优化器来更新模型的权重和偏置,以最小化预测分割掩模与真实标签之间的差异。 6. 模型评估:使用验证集来评估训练得到的UNET模型的表现。常见的评估指标包括准确率、召回率、F1分数等。 7. 模型调优:根据验证集的表现,可以调整UNET模型的超参数,如学习率、批大小、卷积核大小以及网络层数等,以获得更好的性能。 8. 模型测试使用测试集来测试最终训练得到的UNET模型的性能。通过将模型应用于未见过的图像,并与预期的标签进行比较,可以评估模型在真实场景中的表现。 总之,使用UNET进行语义分割自己的数据集需要数据收集、预处理、划分、增强、模型训练、评估、调优和测试等步骤。这些步骤可以帮助您创建一个高性能的语义分割模型,用于将图像分割成不同的语义区域。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 492
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

视觉研坊

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值