语义分割论文:LiteSeg: A Novel Lightweight ConvNet for Semantic Segmentation及其Pytorch实现

LiteSeg: A Novel Lightweight ConvNet for Semantic Segmentation
PDF: https://arxiv.org/pdf/1912.06683.pdf
PyTorch代码: https://github.com/shanglianlm0525/PyTorch-Networks

LiteSeg模型,在Cityscapes数据集上针对640×360分辨率的图像以每秒161帧的速度,达到了67.81%的mIoU精度。

1 概述

提出一个新的更深层的Atrous Spatial Pyramid Pooling module (ASPP),并应用了(Long and short residual connection)长短残差连接以及(Depthwise Separable Convolution)深度可分离卷积,从而得到了一个更快、更有效的语义分割模型。

2 LiteSeg 网络结构图:

LiteSeg 主要基于Deeplab V3+修改而来,下面为两者的对比:
Deeplab V3+:
在这里插入图片描述

LiteSeg:
在这里插入图片描述

区别:

Encoder

  • DASPP在ASPP的每个3 x 3卷积后面再加一个3 x 3的卷积,同时将所有3 x 3的核由256减少为96;
  • 通过 short residual connection融合DASPP的输入和输出;

Decoder

  • 在原来的 3 × 3 卷积后面再添加一个3 × 3 卷积,同时将所有3 x 3的核由256减少为96;
  • 通过 long residual connection融合Backbone的第一阶段输出和Encoder输出;

Pytorch代码:



liteseg是一种新型的轻型卷积神经网络,用于语义分割任务。语义分割是计算机视觉中的一个重要问题,旨在将图像中的不同物体或区域进行标记和分割,从而更好地理解图像的内容。 相比于传统的语义分割方法,liteseg具有以下几个优点。首先,它是一种轻型网络,意味着它在计算资源和存储空间方面要求较低。这使得liteseg能够在资源受限的设备上运行,例如移动设备、嵌入式系统等。 其次,liteseg采用了一种新颖的卷积神经网络架构。这种架构结合了最新的深度学习技术和图像处理技术,旨在提高语义分割的准确性和效率。通过适当选择和组合不同类型的卷积层、池化层和解卷积层,liteseg能够捕捉图像中的不同尺度和领域的信息,并将其应用于语义分割。 第三,liteseg具有较低的模型复杂度。这意味着它需要更少的参数和计算量,从而减少了训练和推理的时间成本。这对于实时应用和大规模数据集的训练非常重要。 最后,liteseg还具有较好的鲁棒性和通用性。它可以应用于各种不同类型的图像和场景,包括自然图像、医学图像、遥感图像等。此外,liteseg在面对不同的光照、尺度变化和噪声等因素时也能保持良好的分割效果。 综上所述,liteseg作为一种新型的轻型卷积神经网络,具有在计算资源有限的设备上高效运行、准确性高、模型复杂度低以及对各种图像和场景具有通用性等优点。它有着广阔的应用前景,并在计算机视觉领域具有重要的研究和实际应用价值。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

mingo_敏

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值