一文读懂DeepLabV3+

最新推荐文章于 2024-08-19 09:04:27 发布

绘视小技巧

最新推荐文章于 2024-08-19 09:04:27 发布

阅读量1.1k

点赞数

文章标签：深度学习计算机视觉人工智能

本文链接：https://blog.csdn.net/weixin_38356756/article/details/121016996

版权

Deeplabv3+

引言
创新点
网络结构
- 特征提取层

引言

在这里插入图片描述
如上图所示，目前DCNN在语义分割的应用主要有两种结构：
（a）SPP通过多种感受野池化不同分辨率的特征来挖掘上下文信息；
（b）Encoder-decoder逐步重构空间信息来更好的捕捉物体的边缘；
本文提出：
（c）在encoder-decoder结构上采用SPP模型。encoder提取丰富的语义信息，decoder恢复精细的物体边缘。encoder允许在任意分辨率下采用空洞卷积

创新点

（1）提出了一个encoder-decoder结构，其包含Deeplabv3作为encoder和高效的decoder模块；
（2）encoder-decoder结构中可以通过空洞卷积来平衡精度和运行时间，现有的encoder-decoder结构事不可行的；
（3）在语义分割任务中采用Xception模型并采用depth-separable convolution，从而更快更有效。

网络结构

在这里插入图片描述

特征提取层

1 ASPP（atrous spatial pyramid pooling）

在这里插入图片描述
上述为deeplabv2的ASPP模块，deeplabv3加入BN层，其中空洞卷积的rate的意思事在普通卷积的基础上，相邻权重之间的间隔rate-1，普通卷积的rate默认为1，所以空洞卷积的实际大小为：
k+（k-1）（rate-1）
输出大小为
Hout = (H+2padding[0]-dilation[0](kernel_size[0]-1)-1)/stride[0]+1
在这里插入图片描述