《LEDNet:A Lightweight Encoder-Decoder Network For Real-Time Semantic Segmentation》论文笔记

代码地址1:LEDNet official
代码地址2:LEDNet unofficial

1. 概述

导读:这篇文章提出的方法LEDNet是用于解决实时场景下的分割任务的,该网络是采用非对称的编解码器结构。具体的,采用ResNet网络作为主干网络,在每个残差块中使用channel split与shuffle减少计算量(shufflenet的思想);在解码器中使用attention pyramid work(APN)来降低网络的复杂度。最后得到的网络参数量少于1M,在CityScapes数据集上单GPU上能够飚到71FPS。

这篇文章的主要贡献:

  • 1)提出了非对称的网络结构LEDNet,减少了网络的参数同时也加快了运行时间;
  • 2)残差块中的channel split与shuffle操作利用了网络的大小与强大的空间表达能力,并且channel shuffle是可微的,也就能端到端训练;
  • 3)在解码器中采用attention机制的Attention Pyramid Network(APN),减少了整个网络的复杂度;

2. 网络设计

2.1 网络结构

文章提出的网络结构见下图所示,很明显是一个非对称的编解码器结构。
在这里插入图片描述
详细的网络设计见下表所示:
在这里插入图片描述
其中,Downsampling Unit是将stride为2,kernel大小为 3 ∗ 3 3*3 33的卷积输出与Max Pooling的输出叠加起来实现下采样的。在解码器的APN模块中使用参数设置为 3 ∗ 3 , 5 ∗ 5 , 7 ∗ 7 + s t r i d e 为 2 3*3,5*5,7*7+stride为2 33,55,77+stride2的三个卷积去产生特征金字塔,之后金字塔特征与编码器输出特征进行点乘融合,再经过Attention操作使得特征得到增强,最后通过上采样得到分割的结果。

2.2 Split与Shuffle的残差块

一般来讲高精度语义分割是计算密集的而且需要较大的memory,对此现有的现有的克服方法大概有两种:网络剪裁压缩与卷积因式分解。文章针对残差块的问题(bottleneck)与channel shuffle(并不适用于轻量级网络)做出了改进得到下图中(d)的残差块结构:
在这里插入图片描述
使用SS-nbt模块带来的好处是:

  • 1)模块的计算高效,使得可以增加更多的特征的channel数量,
  • 2)该模块在输出端才进行channel shuffle可以被认为是一种feature reuse,这样可以在不显著增加网络复杂度的同时提升网络的表达能力。

3. 实验结果

网络的性能与现有的实时分割网络的性能比较:
在这里插入图片描述
各个分类的分割性能比较:
在这里插入图片描述

liteseg是一种新型的轻型卷积神经网络,用于语义分割任务。语义分割是计算机视觉中的一个重要问题,旨在将图像中的不同物体或区域进行标记和分割,从而更好地理解图像的内容。 相比于传统的语义分割方法,liteseg具有以下几个优点。首先,它是一种轻型网络,意味着它在计算资源和存储空间方面要求较低。这使得liteseg能够在资源受限的设备上运行,例如移动设备、嵌入式系统等。 其次,liteseg采用了一种新颖的卷积神经网络架构。这种架构结合了最新的深度学习技术和图像处理技术,旨在提高语义分割的准确性和效率。通过适当选择和组合不同类型的卷积层、池化层和解卷积层,liteseg能够捕捉图像中的不同尺度和领域的信息,并将其应用于语义分割。 第三,liteseg具有较低的模型复杂度。这意味着它需要更少的参数和计算量,从而减少了训练和推理的时间成本。这对于实时应用和大规模数据集的训练非常重要。 最后,liteseg还具有较好的鲁棒性和通用性。它可以应用于各种不同类型的图像和场景,包括自然图像、医学图像、遥感图像等。此外,liteseg在面对不同的光照、尺度变化和噪声等因素时也能保持良好的分割效果。 综上所述,liteseg作为一种新型的轻型卷积神经网络,具有在计算资源有限的设备上高效运行、准确性高、模型复杂度低以及对各种图像和场景具有通用性等优点。它有着广阔的应用前景,并在计算机视觉领域具有重要的研究和实际应用价值。
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值