实时语义分割BiSeNet: Bilateral Segmentation Network for Real-time Semantic Segmentation论文解读

论文链接

http://openaccess.thecvf.com/content_ECCV_2018/papers/Changqian_Yu_BiSeNet_Bilateral_Segmentation_ECCV_2018_paper.pdf

动机

目前加速实时语义分割的方法:(1)限制输入图片的分辨率以减少计算复杂度,但导致了空间细节信息丢失 (2)减少网络通道数,但减弱了空间特征信息容纳能力 (3)减少下采样操作,使得网络结构更加紧凑,但是导致感受野难以覆盖大目标。而当前广泛使用的U-shape structure虽然可以减少空间细节损失,但是有两个缺点:(1)额外的高分辨率的特征图的计算减低了模型速度 (2)大部分在减少通道数或减小输入图片分辨率时损失的空间信息难以通过跳跃连接低层信息进行恢复

贡献

提出Bilateral Segmentation Network (BiSeNet),包含Spatial Path (SP) and Context Path (CP)。SP中只有3个卷积层获得边长为原图边长的1/8的特征图,用于保留丰富的空间信息。在CP中,在xception网络的尾部添加了全局平均池化层,以获得最大的感受野。

在这里插入图片描述

算法

在这里插入图片描述
Spatial path:保存原始图片的空间尺度并编码丰富的空间信息
Context path:使用轻量级的xception网络,加上全局平均池化,从而得到大的感受野,编码高层的语义特征。最后融合全局平均池化后上采样的特征和xception的特征。
Attention refinement module:使用全局平均池化捕捉全局语义信息并计算一个注意力向量引导特征学习,计算量小
Feature fusion module:SP和CP的特征信息是不同的,所以不能简单地element-wise sum。SP中是低层抽象信息,CP中是高层抽象信息,所以设计了FFM进行两个不同特征的融合
损失函数:除了分割损失函数,在CP添加了两个辅助损失函数用于深度监督

实验

数据集

Cityscapes,CamVid,COCO-Stuff

评价指标

参数总量、FPS、mIoU

结果

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

优缺点

优点

1.提出了spatial path和context path结合的思路
2.与其他一些实时分割方法相比,速度更快,效果更好
3.实验非常充分

缺点

1.没有解释清楚两个辅助损失函数的作用,也没有对这两个辅助损失函数的效果做比较实验
在这里插入图片描述
2.图中左边的两个箭头没有解释清楚是什么操作,如果是输入FFM进行concat,应该需要upsample

反思

1.在语义分割中使用辅助的损失函数是否能够提高效果?
2.既然可以分为spatial path和context path,是否可以分出更多path进一步提升效果?

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值