BIR-Net: A Lightweight and Efficient Bilateral Interaction Road Extraction Network
原文:https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=10632593
摘要:
提出了一种用于解决资源限制下道路边界的精确提取问题,提出了一种轻量级的高效双边联合道路提取网络BIR-Net。分别构建了细节分支和语义分支,获取道路细节信息和语义信息;设计了千层交互模块(SIM)来解决遥感图像中高类别差异性和类间相似性。通过两个分支信息的实时交互,突出道路的边缘特征;提出了 深度交互融合模块(DIFM)用于融合来自两个分支的信息。此外,为了解决细长和弯曲道路,开发了道路感知注意模块(RPAM),该模块实时更新方向权值以追踪道路信息,增强网络感知所有道路的能力。实验结果表明,BIRNet只有3.66M的参数和6.49G的FlOPs。此外,CHN6-CUG和深度地球数据集的道路分割精度分别为59.27%和58.36%。本文提出的方法在保持轻量级结构的同时,提高了道路提取的精度。
网络结构
如图,主要包括细节分支(上),语义分支(下)和交互融合三个模块化部分组成。
细节分支
堆叠了多个3*3卷积,步长为2,降采样操作使用3×3卷积,步长为2。获取低层信息和高分辨率的特征表示。
语义分支
通过两种不同的降采样操作融合,有效降低计算成本;后续的降采样中,为了减少计算负荷,用两个3×3深度可分离卷积(DW Conv33))代替5×5深度卷积,用1×1卷积(Conv11)作为投影层将深度卷积的输出投影到低信道容量空间,同时,在不同的语义分支中引入辅助分割头来提取多尺度道路信息。最后使用一个道路感知注意模块(RPAM),以提高网络的道路感知能力。
道路感知注意模块(RPAM)
RPAM模块由三个分支组成:水平分支、垂直分支和全局分支。水平分支和垂直分支用于捕获道路的位置信息,而全局分支捕获全局信息。
交互融合模块
由一个浅层交互模块(SIM)和一个深度交互融合模块(DIFM)组成。SIM模块采用最大池化和双线性插值技术,实现了特征细节和语义分支的通信学习,从而提高了网络对类内和类间遥感图像的感知能力。DIFM通过双边的方式实现了补充细节分支和语义分支信息的功能。
浅层交互模块(SIM)
细节分支的特征图用蓝色表示,而语义分支的特征图用黄色表示。该网络通过合并来自这两个分支的特征信息来促进交互式学习。
深度交互融合模块(DIFM)
对细节分支特征进行降采样并与语义分支特征交互,而对语义分支特征进行升采样并与细节分支特征交互。这种深层的互补性允许通过交互融合来充分利用来自两个分支的信息,实现了来自细节分支和语义分支的深度信息的互补融合。
结果
不同模块加入后的实验对比
与其他网络的对比
不同网络可视化结果