【语义分割】——又快又强:Deep Dual-resolution Networks for Real-time and Accurate Semantic Segmentation of Road

出处:哈尔滨工业大学
论文
code:暂未开源
关键词: 实时语义分割

在这里插入图片描述

语义分割是自动驾驶汽车了解周围场景的关键技术,对于实际的自动驾驶汽车来说,为了获得高精度的分割结果而花费大量的推理时间是不可取的。使用轻量级架构(编码器解码器或two-pathway)或推理在低分辨率图像。本文提出的模型在单张2080ti上DDRNet-slim能打到77.4% mIoU和230FPS,DDRNet-39能打到80.4% mIoU 和 23FPS

1. 简介

  • 提出了一种新的深度双分辨率双边网络用于实时语义分割。
  • 设计了一个新的模块,通过将特征聚合与金字塔池相结合来获取丰富的上下文信息。当它与低分辨率的特征映射集成时,推理时间几乎没有增加。

2. 相关工作

2.1 实时语义
实时语义分割主要从两个方面优化模型结构:1. 编码器-解码器结构; 2. 双通道结果(可以避免decoder时上采样操作带来的特征无法恢复问题)
在这里插入图片描述

3. 模型

文章借鉴了HRNet,重新设计了一个双分辨率的主干网络,并在ImageNet上重新训练。同时为了满足实时性的要求,网络是在resnet18,resnet34上修改而来。
3.1 主干网络
在这里插入图片描述
3.2 语义分割网络

  • 整体网络
    在这里插入图片描述

  • DAPPM上下文捕捉模块:更多尺度特征的融合
    基于pspnet的特征金字塔池化和res2net,提出了一个DAPPM模块,用捕捉高层语义的上下文信息
    在这里插入图片描述

  • 深度监督:多个分支辅助监督学习
    采用了pspnet中的deepsup思路,

4. 实验

不能说是最soa,但是速度是真的快
在这里插入图片描述
和start-of-art的比较
在这里插入图片描述
PPM 和 DAPPM 的比较
在这里插入图片描述
DDRNet和HRNetv2-w18 推理速度的比较
在这里插入图片描述

5. 总结

  • DDRNet感觉是HRNet的一个简化,相当于只有两个分辨率,但是效果更好,归咎于resnet18的残差链接吗?
  • DAPPM上下文特征模块,比PPM尺度更多,
  • 这和SFNet一样,从resnet18出发来做实时语义分割backone。但是效果和精度确实比pspnet-resnet50还好。难道论文的改进点确实有效???
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值