Gated-SCNN: Gated Shape CNNs for Semantic Segmentation

目录

概述:

问题:

解决方法:

细节:

Regular Stream:传统的CNN网络,如VGG,ResNet

Shape Stream:

Gated Convolutional Layer:

 Joint Multi-Task Learning:

 Dual Task Regularizer:


概述:
问题:

当前的神经网络将颜色,形状,纹理信息都一起处理,而这些信息全部包含在分割中或许会导致分割效果不理想

解决方法:

两个并行的CNN网络来解决,作者将他们分别称为regular stream和shape stream。Regular steam的结构与传统的语义分割模型相似。而Shape stream的主要作用是获取图像中的边界信息,最终将两者信息进行融合,从而得到最终的分割结果。

原文:https://arxiv.org/pdf/1907.05740.pdf

代码:https://nv-tlabs.github.io/GSCNN/

细节:

Regular Stream:
传统的CNN网络,如VGG,ResNet

输入为3*H*W的图像,输出为C*H/m*W/m的feature图像,其中m为regulat stream设置的stride值

Shape Stream:

Regular Stream中第一层的Conv的输出和图像的二阶导数图作为input,输出为语义边界(semantic boundary)

 Fusion Module:

将Regular Stream和Shape Stream产生的feature map进行融合,融合采用的是Atrous Spatial Pyramid Pooling方法,具体可参考(https://blog.csdn.net/qq_21997625/article/details/87080576)

Gated Convolutional Layer:

we devise a novel GCL layer that facilitates flow of information from the regular stream to the shape stream

用CGL来帮助shape stream过滤其他信息从而只处理边界相关信息,且要注意的一点就是shape stream并不会整合来自regular steam的信息,相反,它使用GCL来停用其自身的激活,这些激活被regular steam中包含的更高级别信息认为不相关。

第一步:获取attention map


t ∈ 0,1,··· ,m( m denote the number of locations,),rt和st代表着regular streams和shape streams所产生的输入

C1x1为1x1的卷积,||代表着concatenation

第二步:通过GCL层将attention map应用在st上

 就是针对上一层得到的shape分布将其与得到的注意力分布进行点乘,在加上之前的shape分布(这个就是残差计算部分)最后转置后与通道的权重核进行计算。整个过程可以认为是注意力机制的过程。

 Joint Multi-Task Learning:

整体的损失函数如下:

 λ1 ,λ2为超参数, standard binary cross-entropy (BCE),standard crossentropy (CE) loss

  ˆ s为 GT boundaries,ˆ y为GT semantic labels

 Dual Task Regularizer:

其中的G为高斯滤波器,p(y|r,s) ∈ R K×H×W denotes a categorical distribution output of the fusion module

输出代表某个像素是否属于某张图片的某个semantic boundary

作者通过预测值与真实值之间的差的绝对值作为regular steam的正则项去,其公式如下:

p + contains the set of all non-zero pixel coordinates in both ζ and ζˆ 

作者希望确保当与GT边界不匹配时边界像素受到惩罚,并且避免非边界像素支配损失函数。所以在下面的正则项中利用的是边界预测和在边界区域的语义分割的二元性。其公式:

thrs本文设置为0.8

最终将两个子任务的正则项进行融合得到最终双任务的正则项:

 

 

参考:https://www.zhihu.com/people/yanpeng-sun/posts

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值