论文阅读:RefineNet: Multi-Path Refinement Networks for High-Resolution Semantic Segmentation

RefineNet是为了解决深度卷积网络在高分辨率图像处理中损失空间信息的问题而提出的。它采用了残差卷积单元(RCU)、多分辨率融合模块(MRF)和串联残差池化模块(CRP),在多个数据集上实现了最佳性能。这些模块旨在恢复和融合不同尺度的图像信息,提高分割的准确性。
摘要由CSDN通过智能技术生成

1 摘要

随着CNN的不断发展,涌现了很多深度较深的CNN如ResNet系列,它们非常适合用于完成稠密分割任务,如语义分割。但是由于CNN需要反复地进行下采样,这样导致了图像分辨率不断地降低,容易丢失了图像的一些空间信息,这样对于一些高分辨率的图像就非常不友好了。针对这个问题,作者提出一种RefineNet,引入了残差卷积模块(Residual Convolution Unit)、多分辨率融合模块(Multi-Resolution Fusion)和串联残差池化模块(Chained Residual Pooling)等结构,非常有效地对空间分辨率进行恢复,在7个数据集中均达到SOTA。

2 亮点

在当时,DeepLab是表现最好的网络,但是作者指出有两点缺陷:
① 在高分辨率图像中,存在高维特征,会使得DeepLab消耗大量计算资源。
② DeepLab使用空洞卷积虽然能够获得更大的感受野,但是这样会使得高分辨率图像的一些空间信息丢失,使图像变得粗糙。作者提出的RefineNet主要通过使用三大模块去避免这些问题。

2.1 残差卷积模块(RCU)

作者提出的RCU模块参考了ResNet的残差块,在模块内分成两条线路,如下图:
在这里插入图片描述
主干线为图像直接的输入,而支线的图像先经过ReLU、3x3卷积、ReLu、3x3卷积,再与主干线路进行特征融合叠加,残差卷积部分可以理解为对特征图进行信息的补充,使得图像信息更加丰富。

2.2 多分辨率融合模块(MRF)

图像通过残差卷积模块以后便要进入MRF模块,MRF模块主要是对不同尺度的图像进行特征提取和上采样到同样的分辨率,最后进行融合,如下图:
在这里插入图片描述
不同尺度的图像都进入对应的通道进行3x3卷积,再进行一个双线性插值法的上采样,不同通道的图像最终都上采样成同一分辨率的图像,最终进行融合叠加,将结果送往下一层。

<
  • 1
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值