论文地址:ESPNet: Efficient Spatial Pyramid of Dilated Convolutions for Semantic Segmentation
这是ECCV2018的一篇语义分割的论文
ESP(Efficient spatial pyramid)
文中提出了一个ESP(Efficient spatial pyramid)模块来对传统卷积进行factorization达到改进的效果
Convolution factorization: Convolutional factorization decomposes the convolutional operation into multiple steps to reduce the computational complexity.例如Xception、ResNeXt、Xception、MobileNets等
改进分为两步:
1、point-wise conv
也就是先使用1*1卷积对输入的M个通道的feature map进行降维成d个通道,以减少计算量
2、spatial pyramid of dilated conv
也就是使用金字塔空洞卷积来对降维后的特征图进行操作,提高感受野
使用K个不同rate的卷积核为n*n、rate=的空洞卷积进行操作
具体流程如上图所示,分为几个reduce、split、transform、merge几个步骤
图中M为输入feature map的通道数、、K为分组数量、、在本文中n=3
ESPNet
其中红色框代表下采样、蓝色框代表上采样,(# input channels, # output channels)