一文读懂DeepLabV3+

引言

在这里插入图片描述
如上图所示,目前DCNN在语义分割的应用主要有两种结构:
(a)SPP通过多种感受野池化不同分辨率的特征来挖掘上下文信息;
(b)Encoder-decoder逐步重构空间信息来更好的捕捉物体的边缘;
本文提出:
(c)在encoder-decoder结构上采用SPP模型。encoder提取丰富的语义信息,decoder恢复精细的物体边缘。encoder允许在任意分辨率下采用空洞卷积

创新点

(1)提出了一个encoder-decoder结构,其包含Deeplabv3作为encoder和高效的decoder模块;
(2)encoder-decoder结构中可以通过空洞卷积来平衡精度和运行时间,现有的encoder-decoder结构事不可行的;
(3)在语义分割任务中采用Xception模型并采用depth-separable convolution,从而更快更有效。

网络结构

在这里插入图片描述

特征提取层

1 ASPP(atrous spatial pyramid pooling)

在这里插入图片描述
上述为deeplabv2的ASPP模块,deeplabv3加入BN层,其中空洞卷积的rate的意思事在普通卷积的基础上,相邻权重之间的间隔rate-1,普通卷积的rate默认为1,所以空洞卷积的实际大小为:
k+(k-1)(rate-1)
输出大小为
Hout = (H+2padding[0]-dilation[0](kernel_size[0]-1)-1)/stride[0]+1
在这里插入图片描述

2 Encoder-decoder

encoder逐渐减小feature map并提取最高语义信息
decoder逐步恢复空间信息
在这里插入图片描述

3 Depthwise separable convolution

深度可分离卷积或group convolution,在保持性能前提下,有效降低了计算量和参数量
逐点卷积,只改变特征图的数量,不改变特征图的大小
在这里插入图片描述
逐通道卷积只改变特征图的大小,不改变特征图的数量。

总结

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

绘视小技巧

本人识别赛top2整理内容齐齐

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值