DABNet: Depth-wise Asymmetric Bottleneck for Real-time Semantic Segmentation
摘要
语义分割作为一项像素级的预测任务,需要巨大的计算量和参数才能获得高性能。最近,由于对自主系统和机器人的需求不断增加,在准确性和推理速度之间进行权衡是很重要的。本文提出了一种新颖的深度不对称瓶颈模块来解决这一难题,该模块有效地采用深度不对称卷积和扩张卷积来构建瓶颈结构。基于深度非对称瓶颈网络模块,我们设计了一个深度非对称瓶颈网络(DABNet),专门用于实时语义分割,它创造了足够的感受野,并密集地利用了上下文信息。在城市场景和摄像机视频数据集上的实验表明,该方法实现了速度和精度的平衡。具体来说,在没有任何预处理模型和后处理的情况下,它在Cityscapes测试数据集上实现了70.1%的平均IoU,在单个GTX 1080Ti卡上只有76万个参数和104 FPS的速度。
作者的想法
许多现有的以实时为目标的语义分割模型在其网络中采用了扩张卷积,另一种有效减少参数数量的方法是深度方向可分离卷积(ds-Conv)。它独立计算跨通道和空间相关性,这在轻量级模型中广泛使用。然而,简单地用ds-Conv代替标准卷积会导致大的性能下降