语义分割及DeeplabV3+模型

ViperL1

已于 2022-11-19 11:35:44 修改

阅读量1.5k

点赞数

分类专栏：神经网络学习笔记文章标签：人工智能

于 2022-11-17 21:00:52 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_37878740/article/details/127910945

版权

学习笔记同时被 2 个专栏收录

155 篇文章 12 订阅

订阅专栏

72 篇文章 16 订阅

订阅专栏

一、基本概念

将视觉输入分为不同的语义可解释类别；通俗点说就是区分不同部分。

分类：

b)语义分割 c)实例分割 d)全景分割

语义分割一般以平均IOU(Intersection Over Union,并交比)来评价性能，其公式如下：

$IOU=\frac{Overlap}{Union}=\frac{A_{pred}\bigcap A_{true}}{A_{pred}\bigcup A_{true}}$ 目的是使得目标与预测尽可能交叠。

除此之外还有可以选择像素正确率：PA=正确像素之和 / 总像素之和

像素正确率平均值：MPA=1 / (k+1)*PA

一般而言语义分割分为以下流程。

输入-->分类器-->后处理-->最终结果

二、DeeplabV3+模型

①网络结构

！DeeplabV3+在编码器部分引入了大量空洞卷积；可以在不损失信息的情况下增大感受野（提升每个卷积输出包含的信息量）

②BackBone

原文采用的主干网络为Xceprion，如算力不足也可用MobileNetV2作为主干网络。

MobileNetV2由Inverted resblock组成，其网络结构如下：

分为左半边的主干部分和右半边的残差部分。主干部分的组成及其作用：

1x1卷积核：升维

3x3卷积核：特征提取

1x1卷积核：降维

！！！一般DeepLabV3中会进行3次或4次下采样（但不会是5次）

使用BackBone提取后会得到两个有效特征层：压缩2次的结果和压缩4次的结果

③加强特征提取结构

可分为两部分：Encoder和Decoder。

Encoder

对压缩4次的有效特征层

分别用不同rate的空洞卷积

进行特征提取，合并，再通过1x1卷积进行压缩

Decoder

对压缩2次的有效特征层

利用1x1卷积调整通道数，再和空洞卷积后的有效特征层上采样的结果进行堆叠，随后进行两次深度可分离卷积块。

④利用特征预测结果

可以分为2步：

1.利用1x1卷积进行通道调整，调整成Num_Class

2.利用resize进行上采样，最终得到和输入图片长宽一致的输出层。（放大）

特别鸣谢Bubbliiiing，大家也可以去看他的原文DeepLabV3+

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
语义分割及DeeplabV3+模型

语义分割及DeepLabV3+网络的解析
复制链接

扫一扫

专栏目录

ViperL1 CSDN认证博客专家 CSDN认证企业博客

码龄7年

246: 原创

7万+: 周排名

9493: 总排名

36万+: 访问

: 等级

3358: 积分

1088: 粉丝

458: 获赞

128: 评论

2015: 收藏

私信

关注

热门文章

分类专栏

最新评论

[高光谱]PyTorch使用CNN对高光谱图像进行分类
m0_58545845: 求助大佬，以2DCNN举例，为什么卷积层是Conv3d啊
[高光谱]使用PyTorch的dataloader加载高光谱数据
十月天下第一: 你好，我想对高光谱做图像级别的分类，应该对应哪个dataset类啊
[图神经网络]ViG(Vision GNN)网络代码实现
ViperL1: 代码没问题，是能够复现的。Loss出nan应该是反向传播的问题，建议检查一下分类头
[图神经网络]ViG(Vision GNN)网络代码实现
now_try_: 博主你好，想问下你复现成功代码了吗？我用imagenet-mini数据集（4G），在单卡GPU上训练，出现这样的结果：Test: [ 0/61] Time: 2.965 (2.965) Loss: 6.9609 (6.9609) Acc@1: 1.5625 ( 1.5625) Acc@5: 3.1250 ( 3.1250) Test: [ 50/61] Time: 0.179 (0.234) Loss: 7.0898 (7.0612) Acc@1: 0.0000 ( 0.1532) Acc@5: 0.0000 ( 0.4902) Test: [ 61/61] Time: 19.545 (0.536) Loss: 7.4766 (7.0625) Acc@1: 0.0000 ( 0.1529) Acc@5: 0.0000 ( 0.5098) Test (EMA): [ 0/61] Time: 4.346 (4.346) Loss: nan ( nan) Acc@1: 4.6875 ( 4.6875) Acc@5: 29.6875 (29.6875) Test (EMA): [ 50/61] Time: 0.176 (0.259) Loss: nan ( nan) Acc@1: 0.0000 ( 0.0919) Acc@5: 0.0000 ( 0.5821) Test (EMA): [ 61/61] Time: 0.176 (0.244) Loss: nan ( nan) Acc@1: 0.0000 ( 0.0765) Acc@5: 0.0000 ( 0.4843)
[图神经网络]ViG(Vision GNN)网络代码实现
Jiaqi Lee: 是这样的，可视化结果之后，边缘都不清晰，比较模糊

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。