Large Kernel Matters ——Improve Semantic Segmentation by Global Convolutional Network
发表日期:8 May 2017
本文主要提出两种结构,全局卷积网络(Global Convolutional Network,GCN),Boundary Refinement block(BR)
GCN同时改善分类和定位的性能。
目前state-of-art的语义分割设计方法都是为了更好的定位,但这会降低分类的效果。从分类的角度,网络应该使用大的卷积核,这样能使分类器具有更强的分类能力来应对各种变换。使用Boundary Refinement block来进行边界对齐,该模块使用残差结构。
1.GCN
目前state-of-art的语义分割设计方法都是为了更好的定位,但这会降低分类的效果。而分类的效果差可能由于感受野造成的。当分类的有效感受野(能够获得有效信息的感受野)足以覆盖整个物体的时候,这个时候分类器就可以正确的分类。
网络设计用FCN,卷积的kernel size越大越好,但是越大的卷积核计算量越大,作者提出1*k+k*1和k*1+1*k的卷积组合,相当于feature map的k*k大小区域。在这里的卷积之后没有使用非线性激活函数。
2.Boundary Refinement
侧边的残差连接可以对boundary进行refine
3.网络结构
ResNet作为特征提取;使用ResNet不同stage的feature map,是多尺度框架;经过上采样输出结果
参考: