【Bubbliiiing视频记录】Pytorch 搭建自己的Unet语义分割平台

书文的学习记录本

已于 2023-07-04 16:45:53 修改

阅读量3.4k

点赞数 6

分类专栏：视频总结文章标签：深度学习 pytorch 人工智能 unet

于 2023-07-03 00:30:00 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43935969/article/details/131504775

版权

视频总结专栏收录该内容

4 篇文章 0 订阅

订阅专栏

该文介绍了语义分割的概念，通过UNet网络结构进行图像像素级分类，其中使用VGG16作为BackBone。文章详细讲解了UNet的组成，包括特征提取、FPN的构建和预测过程，并提到了数据集的制作方法，如使用labelme工具进行标注。此外，还讨论了训练参数，如focalloss用于处理样本不平衡问题，以及miou作为评估指标。

摘要由CSDN通过智能技术生成

来源

什么是语义分割

语义分割：对图像每个像素点进行分类
在这里插入图片描述常见神经网络处理过程：Encoder提取特征，接着Docoder恢复成原图大小的图片

UNet整体结构

分为三个部分

主干特征提取部分：
- 卷积和最大池化的堆叠
- 获得五个初步有效特征层
加强特征提取部分：
- 五个初步有效特征层进行上采样 + 特征融合
- 获得一个最终融合了所有特征的有效特征层
预测部分
最后一个有效特征层对每一个特征点进行分类

在这里插入图片描述

BackBone-主干特征提取网络

bubbliiing使用的是VGG16作为主干特征提取网络。
UNet具体使用VGG16红色框线内的内容
在这里插入图片描述具体实现代码：

卷积核都是1 × 1的，所以不改变高和宽，卷积核个数改变深度
M：最大池化，长和宽 / 2

加强特征提取网络-FPN的构建

这块的步骤：堆叠->卷积->堆叠->卷积
在这里插入图片描述代码部分，主要unetUp来实现
一小步的实现如下两图：

所有，最后输出的是512， 512， 64的特征层

利用特征获得最终的预测结果

利用1 × 1卷积，指定输出类别数目，即可
在这里插入图片描述

预测过程详解

unet的预测效果如下：
在这里插入图片描述代码过程如下所示：

数据集格式

JPEGImages：原图
SegmentationClass：标签（灰度图，飞机是1，人是15）
Segmentation
- train.txt：训练集图片名字
- val.txt：验证集图片名字

在这里插入图片描述

数据集的制作

使用一个软件labelme，版本3.16.7

pip install labelme==3.16.7 # 安装
labelme # 运行

在界面中通过一个闭环人工标注（真肝呀，yyds）
在这里插入图片描述
会生成对应的json文件
利用json_to_dataset文件，输入自己的类别，得到分割结果
得到分割结果

训练参数解析

num_class = 实际类别+1（背景）
在这里插入图片描述
冻不冻结？

使用focal loss可以防止样本不平衡
在这里插入图片描述
核心是给不同的权重

训练自己的数据集

之前做好的数据集，用voc_annotation进行划分

在这里插入图片描述

miou 评价指标计算

在这里插入图片描述

看完了，完结撒花，不过想做分割的话，接下来看看sam，unet接下来可以看看变种了！

书文的学习记录本

关注

6
点赞
踩
19

收藏

觉得还不错? 一键收藏
打赏
1
评论
【Bubbliiiing视频记录】Pytorch 搭建自己的Unet语义分割平台

语义分割：对图像每个像素点进行分类常见神经网络处理过程：Encoder提取特征，接着Docoder恢复成原图大小的图片。
复制链接

扫一扫

专栏目录

书文的学习记录本 CSDN认证博客专家 CSDN认证企业博客

码龄6年

国防科技大学

110: 原创

8万+: 周排名

15万+: 总排名

10万+: 访问

: 等级

1570: 积分

759: 粉丝

207: 获赞

56: 评论

557: 收藏

私信

关注

热门文章

分类专栏

简单记录 24篇
安装软件 2篇
CTF 28篇
datawhale 13篇
视频总结 4篇
论文 5篇
降水 3篇
coursera 1篇
深度学习 4篇
导 1篇
前后端学习 8篇
编程语言学习 5篇
生活 1篇
算法 1篇
博客 1篇
大数据 4篇

最新评论

度量学习损失
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
hitcon_2014_stkof详解
Hertant: 2024打卡
0ctf_2017_babyheap详解
m0_54741246: 师傅，为什么字节错位之后前面三位0x00 0x00 0x7f到后面了
【学习打卡】GradCAM可解释性分析
AI布道: GAP全局平均池化，只是做池化操作，不需要像卷积层一样训练参数，CAM方法为什么需要重新训练原有模型。请指教。谢谢
PlotNeuralNet resnet18绘图
凉光: 你好，请问您这是Resnet18的绘图吗，另外请问我想更换输入在哪里更换呢？

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

书文的学习记录本 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。