论文阅读-语义分割(2021)-DDRNet:用于实时道路场景精准分割的深度冗余分辨率网络

DDRNet

论文:Hong Y, Pan H, Sun W, et al. Deep dual-resolution networks for real-time and accurate semantic segmentation of road scenes

地址:https://paperswithcode.com/paper/deep-dual-resolution-networks-for-real-time
在这里插入图片描述

论文阅读与模型介绍

  DDRNet用于道路场景的实时分割模型,模型基本流程如下图所示,网络经过一个主干模块后分为两个具有不同分辨率的平行分支,一个分支保持较高的分辨率另一个分支则通过多阶段下采样操作获得丰富的语义信息,两个分支的信息融合则通过双向桥接模块完成,模型最后还添加了一个DAPPM模块增加感受野以提取更丰富的语义信息。
在这里插入图片描述

冗余分辨率网络

  1)ResNet网络的Stage3阶段后新增一条高分辨率通路,保持特征图尺寸为8x下采样;2)ResNet的stem阶段的7×7卷积替换为两个3×3卷积;3)通路由残差模块RB构成,每条通路尾部增加一个BottleNeck模块RBB;4)高分辨率通路的特征图和低分辨率通路的特征图一一对应以进行双向融合。

双向融合

  如下图所示,对于high2low融合,高分辨率特征图首先经过一系列步长为2的3×3卷积进行下采样然后与低分辨率特征图进行pointwise相加;对于low2high融合,低分辨率特征图首先经过一个1×1卷积进行通道降维,之后使用双线性插值上采样扩张尺寸后与高分辨率特征图进行pointwise相加。
在这里插入图片描述

深度聚合空间金字塔池化模块-DAPPM

  如下图所示,首先对输入的64x下采样特征图应用大尺寸池化核与指数增长的步长以生成尺寸为128x、256、以及512x下采样的特征图,并逐步分层融合,首先对特征图应用1×1卷积后进行上采样,后通过3×3卷积后与上一层及的特征图进行进行融合(论文认为这里最大的特征图尺寸不过1/64,所以推理负担不大)。

实验结果

定量(Cityscapes)

定性

  从左到右:输入图像、GT掩码、DDRNet-23-slim预测结果、DDRNet-23预测结果


欢迎扫描二维码关注微信公众号 深度学习与数学 ,每天获取免费的大数据、AI等相关的学习资源、经典和最新的深度学习相关的论文研读,算法和其他互联网技能的学习,概率论、线性代数等高等数学知识的回顾。
在这里插入图片描述

  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值