【语义分割】——又快又强:Deep Dual-resolution Networks for Real-time and Accurate Semantic Segmentation of Road

出处:哈尔滨工业大学
论文
code:暂未开源
关键词: 实时语义分割

在这里插入图片描述

语义分割是自动驾驶汽车了解周围场景的关键技术,对于实际的自动驾驶汽车来说,为了获得高精度的分割结果而花费大量的推理时间是不可取的。使用轻量级架构(编码器解码器或two-pathway)或推理在低分辨率图像。本文提出的模型在单张2080ti上DDRNet-slim能打到77.4% mIoU和230FPS,DDRNet-39能打到80.4% mIoU 和 23FPS

1. 简介

  • 提出了一种新的深度双分辨率双边网络用于实时语义分割。
  • 设计了一个新的模块,通过将特征聚合与金字塔池相结合来获取丰富的上下文信息。当它与低分辨率的特征映射集成时,推理时间几乎没有增加。

2. 相关工作

2.1 实时语义
实时语义分割主要从两个方面优化模型结构:1. 编码器-解码器结构; 2. 双通道结果(可以避免decoder时上采样操作带来的特征无法恢复问题)
在这里插入图片描述

3. 模型

文章借鉴了HRNet,重新设计了一个双分辨率的主干网络,并在ImageNet上重新训练。同时为了满足实时性的要求,网络是在resnet18,resnet34上修改而来。
3.1 主干网络
在这里插入图片描述
3.2 语义分割网络

  • 整体网络
    在这里插入图片描述

  • DAPPM上下文捕捉模块:更多尺度特征的融合
    基于pspnet的特征金字塔池化和res2net,提出了一个DAPPM模块,用捕捉高层语义的上下文信息
    在这里插入图片描述

  • 深度监督:多个分支辅助监督学习
    采用了pspnet中的deepsup思路,

4. 实验

不能说是最soa,但是速度是真的快
在这里插入图片描述
和start-of-art的比较
在这里插入图片描述
PPM 和 DAPPM 的比较
在这里插入图片描述
DDRNet和HRNetv2-w18 推理速度的比较
在这里插入图片描述

5. 总结

  • DDRNet感觉是HRNet的一个简化,相当于只有两个分辨率,但是效果更好,归咎于resnet18的残差链接吗?
  • DAPPM上下文特征模块,比PPM尺度更多,
  • 这和SFNet一样,从resnet18出发来做实时语义分割backone。但是效果和精度确实比pspnet-resnet50还好。难道论文的改进点确实有效???
  • 3
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
你好!对于 "Region-Based Convolutional Networks for Accurate Object Detection and Segmentation" 这篇论文的复现,我可以给你一些指导。该论文介绍了一种基于区域的卷积神经网络方法,用于准确的物体检测和分割。 首先,你需要了解论文中提出的方法的核心思想和技术细节。然后,你可以按照论文中描述的步骤进行复现。以下是一些可能的步骤: 1. 数据集准备:根据论文中使用的数据集,你需要获取相应的训练集和测试集数据。确保数据集包含物体检测和分割的标注信息。 2. 模型架构:根据论文中描述的模型架构,你可以使用深度学习框架(如TensorFlow、PyTorch等)来构建模型。确保按照论文中提到的网络层次结构、连接方式和参数设置来构建模型。 3. 损失函数:根据论文中提到的损失函数,你可以实现相应的损失函数来衡量检测和分割任务的性能。 4. 训练过程:使用训练集数据对模型进行训练。根据论文中提到的训练策略和超参数设置,你可以使用反向传播算法来更新模型的权重。 5. 测试过程:使用测试集数据对训练好的模型进行测试。评估模型在物体检测和分割任务上的性能,并与论文中的结果进行比较。 请注意,由于论文可能没有提供完整的代码实现,你可能需要根据论文的描述进行一定的调整和优化。 希望这些步骤能为你复现该论文提供一些帮助!如果你有任何进一步的问题,欢迎继续提问。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值