论文地址:
LEDNet: A Lightweight Encoder-Decoder Network for Real-Time Semantic Segmentationarxiv.org1.方法思路
论文指出计算机视觉中诸如语义分割等密集预测任务使用CNN,对于计算资源的要求过大,限制了其在移动设备上的应用,为此提出LEDNet,一个包含不对称编解码结构的轻量级的网络用于实时语义分割。其中编码结构采用ResNet作为主干网络,修改残差结构加入通道分类和混洗操作;解码结构中设计了注意力金字塔网络APN来进一步减少网络的计算复杂度吗,最后LEDNet以小于1M的参数量,在1080Ti的显卡上FPS达到71,CityScapes测试集mIoU为70.6%,速度精度权衡方面取得了SOTA效果。
具体地,论文提出的分割网络包含两部分,结构如下图所示,该方法同时关注精度和速度,采用不对成的编解码结构。根据卷积操作分解的原则,编码结构的核心,新型残差块包括跳跃结构和通道分离和混洗ÿ