道路分割论文研读之D-LinkNet ：LinkNet with Pretrained Encoder and Dilated Convolution for High Resolution Sate

最新推荐文章于 2023-05-20 16:52:59 发布

hr_net

最新推荐文章于 2023-05-20 16:52:59 发布

阅读量2.6k

点赞数 3

分类专栏：深度学习文章标签：算法路网生成

本文链接：https://blog.csdn.net/qq_38742161/article/details/105821394

版权

深度学习专栏收录该内容

45 篇文章 2 订阅

订阅专栏

本人最近在研究路网生成算法，遇到瓶颈，借鉴卫星图识别的经典算法。

1.Introduction:

道路提取可视为二值语义分割任务，像素级二分类。

卫星图路网分割的挑战：

1. 输入的图像是高分辨率的，因此网络应该有大的接收范围，可以覆盖整个图像。2. 卫星图像中的道路往往细长复杂，覆盖了整个图像的一小部分。在这种情况下，保存详细的空间信息非常重要。3. 道路具有天然的连通性和较大的跨度。考虑到道路的这些自然属性是必要的。

通俗解释下上述挑战，因为道路长，可能横贯整个样本，所以需要大的视野域进行特征提取；因为道路细，前景背景占比悬殊，所以需要保留特征的空间信息，故扩大视野域不适合增加pooling层，从而破坏空间特征。扩大视野域的另一个好处是可以学习到道路的连通性和跨度特征。

Linknet是一种有效的语义分段神经网络，它利用了跳跃连接、残差块和编解码器结构的优点。

D-LinkNet使用带有预训练的编码器Linknet作为其主干，并且在中心部分具有附加的膨胀卷积层。因此本文的闪光点在于添加膨胀卷积层扩充视野域。

膨胀卷积的优势：

膨胀卷积是在不降低特征图分辨率的情况下增大特征点的感受野。通常有两种模式，级联和并行模式，这两种模式都显示出很强的提高分割精度的能力。我们充分利用了这两种方式的优点，采用快捷连接的方式将这两种方式结合起来。使用池化层可以成倍增加特征点的感受野，但可能会降低特征图的分辨率，并丢失空间信息。pooling减小图像尺寸增大感受野后用upsampling扩大图像尺寸同样可以保持分辨率的同时扩大感受野，但是在先减小再增大尺寸的过程中，肯定有一些信息损失掉了。因此空洞卷积层是池化层的理想的代替选择。

在语义切分领域，用ImageNet预先训练的权值初始化编码器取得了令人满意的结果。

2. Network Architecture

D-LinkNet分为三部分 A, B, C三部分, 分别是 encoder, center part 和 decoder 。