旷视最新-Large Kernel Matters —— Improve Semantic Segmentation by Global Convolutional Network

一句话总结

如文章名字所言,本文主要强调大的kernel的重要性,pascal上82.2%。文章的试验和分析还是挺细致的。

故事背景

文章认为,classification和localization之间是有冲突的,我们平时所用的卷积分割网络,在提高分割效果的同时,削弱了分类的能力。文中认为通过设置大的感受野可以获得featuremap与pixel score之间的densely connections。

1 Global Convolutional Network

文章所谓的Global Convolutional Network 是增大kernel size获得更大的感受野,而增加感受野的方式如下:
这里写图片描述
使用了 K x 1和1 x K的卷积核,计算量小,参数少
另外作者在使用GCN提高分类能力的同时,增加了一个Boundery Refinement的 模块来增加边缘信息。

这里写代码片

2 overall Framework

这里写图片描述
总的来说就是将multiscalar的score map不断融合相加

3 Experiment

3.1 Ablation Experiments- Large Kernel

要比较的是 下图中不同k的左侧与右侧,右侧为base

列表内容
这里写图片描述
可以较明显的可以看出随着k增加 效果越好
接下是来排除另外两种增大kernelsize的形式:
- 首先:
这里写图片描述
上图即表中的conv
这里写图片描述
作者认为参数太多不好优化造成了效果下降
- 其次:
这里写图片描述

这里写图片描述
同样通过下面的试验试图说明 随着参数的减少,stack的效果越来越差,所以认为kx1这种效果好
这里写图片描述

文中的另外一个试验,说明GCN主要对提高分类能力有帮助,BR主要对边缘有帮助
这里写图片描述

3.2 Pretrained model

动过手的都知道 没有pretrain 模型是很头疼的问题,本文实验证明,没有pretrained model也可以得到较好的效果
这里写图片描述

3.3 pascal voa 2012及cityscapes

文章训练分了三部分,首先使用了 pascal + sbd +coco 然后使用了pascal—+sbd 最后只用了pascal voa 2012。
试验中MS竟然只提高了0.1个点。。。
这里写图片描述
cityscapes中测试的时候讲图片分了四个1024 x 1024的图片最后fuse,最后76.9%

  • 4
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值