旷视最新-Large Kernel Matters —— Improve Semantic Segmentation by Global Convolutional Network

最新推荐文章于 2023-07-16 10:31:49 发布

bea_tree

最新推荐文章于 2023-07-16 10:31:49 发布

阅读量1w

点赞数 4

文章标签：分割旷视科技孙剑

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/bea_tree/article/details/60977512

版权

分割专栏收录该内容

11 篇文章 0 订阅

订阅专栏

一句话总结

如文章名字所言，本文主要强调大的kernel的重要性,pascal上82.2%。文章的试验和分析还是挺细致的。

故事背景

文章认为，classification和localization之间是有冲突的，我们平时所用的卷积分割网络，在提高分割效果的同时，削弱了分类的能力。文中认为通过设置大的感受野可以获得featuremap与pixel score之间的densely connections。

1 Global Convolutional Network

文章所谓的Global Convolutional Network 是增大kernel size获得更大的感受野，而增加感受野的方式如下：
这里写图片描述
使用了 K x 1和1 x K的卷积核，计算量小，参数少
另外作者在使用GCN提高分类能力的同时，增加了一个Boundery Refinement的模块来增加边缘信息。

这里写代码片

2 overall Framework

这里写图片描述
总的来说就是将multiscalar的score map不断融合相加

3 Experiment

3.1 Ablation Experiments- Large Kernel

要比较的是下图中不同k的左侧与右侧，右侧为base

列表内容
这里写图片描述
可以较明显的可以看出随着k增加效果越好
接下是来排除另外两种增大kernelsize的形式：
- 首先：

上图即表中的conv

作者认为参数太多不好优化造成了效果下降
- 其次：

这里写图片描述
同样通过下面的试验试图说明随着参数的减少，stack的效果越来越差，所以认为kx1这种效果好

文中的另外一个试验，说明GCN主要对提高分类能力有帮助，BR主要对边缘有帮助
这里写图片描述

3.2 Pretrained model

动过手的都知道没有pretrain 模型是很头疼的问题，本文实验证明，没有pretrained model也可以得到较好的效果
这里写图片描述

3.3 pascal voa 2012及cityscapes

文章训练分了三部分，首先使用了 pascal + sbd +coco 然后使用了pascal—+sbd 最后只用了pascal voa 2012。
试验中MS竟然只提高了0.1个点。。。
这里写图片描述
cityscapes中测试的时候讲图片分了四个1024 x 1024的图片最后fuse，最后76.9%

关注

4
点赞
踩
12

收藏

觉得还不错? 一键收藏
1
评论
旷视最新-Large Kernel Matters —— Improve Semantic Segmentation by Global Convolutional Network

一句话总结如文章名字所言，本文主要强调大的kernel的重要性,pascal上82.2%。文章的试验和分析还是挺细致的。故事背景文章认为，classification和localization之间是有冲突的，我们平时所用的卷积分割网络，在提高分割效果的同时，削弱了分类的能力。文中认为通过设置大的感受野可以获得featuremap与pixel score之间的densely connec
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。