2019-CVPR-香港中文大学-UPSNet: A Unified Panoptic Segmentation Network

Semantic Segmentation Head:语义分割头的目标是在不区分实例的情况下分割所有的语义类。它可以帮助改进实例分割,在实例分割中实现对thing类的良好效果。

我们的语义头由一个基于可变形卷积子网络构成,该子网络以FPN的多尺度特征为输入。特别地,我们使用了包含256个通道的FPN的p2、p3、p4和p5特征图,它们分别是原始比例尺的1/4、1/8、1/16和1/32。这些特征图首先独立经过相同的可变形卷积网络,然后向上采样到1/4尺度。然后我们将它们串联起来,用带有softmax的1×1卷积来预测语义类。

实验证明,可变形卷积与多尺度特征级联的方法提供与其它模型一样好的语义分割结果,比如PSPNet。

语义分割头与规则的像素方向交叉熵损失有关。为了更加强调前景对象,例如行人,我们还考虑了RoI损失。在训练中,我们使用实例的ground truth bound box对经过1×1卷积后的logits map进行裁剪,然后根据Mask R-CNN将其调整为28×28。然后,RoI损失是在28×28个patch上计算的交叉熵,这相当于在实例中对不正确分类的像素进行更多的惩罚。在消融研究的后期,我们通过实验发现这种RoI损失在不影响语义分割的前提下,有助于提高全景分割的性能。

 

语义分割时,论文作者使用了cross entropy loss和ROI loss。

 

可变形卷积

标准卷积中的规则格点采样是导致网络难以适应几何形变的“罪魁祸首”。为了削弱这个限制,研究员们对卷积核中每个采样点的位置都增加了一个偏移的变量。通过这些变量,卷积核就可以在当前位置附近随意的采样,而不再局限于之前的规则格点。这样扩展后的卷积操作被称为可变形卷积(deformable convolution)

可变形卷积核的大小和位置可以根据当前需要识别的图像内容进行动态调整,其直观效果就是不同位置的卷积核采样点位置会根据图像内容发生自适应的变化,从而适应不同物体的形状、大小等几何形变。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

WX Chen

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值