摘要
- 研究点:CNN做语义分割
- 工程主页:http://liangchiehchen.com/projects/DeepLab.html
- 主要贡献:
-
atrous conv: 可以控制参与卷积的feature的分辨率
Subsample -> Conv(kernel) 和 AtrousConv(kernel) -> Subsample 等价,且 AtrousConv(kernel) 平移不变。
参考博客:http://blog.csdn.net/u012759136/article/details/52434826#t9 -
atrous spatial pyramid pooling (ASPP) : 可以在不同的scale下分割物体。 -
定位物体边界更加精确!将 DCNN layer 最后的输出与 fully connected Conditional Random Field (CRF)结合,克服了DCNN中最大池化和下采样造成的定位精度不准的问题。
-
- 关键词: 语义分割;atrous convolution; CRF
1 Introduction
DCNN在语义分割这一块的局限性:
(1) 分辨率下降(max-pooling and downsampling 的stride引起)reduced feature resolution
引用了FCN做语义分割的[14] ,并指出其缺点是空间分辨率大大降低!作者为克服该问题,去掉了池化后几层的下采样操作,而在后续的几层卷积层中加入了上采样操作。
Use atrous convolution as a shorthand for convolution with upsampled filters
atrous convolution [3,6,16]
相比采用deconv(反卷积)的方法[13,14],作者采用的atrous conv+线性插值的方法也非常有效。
其优势在于:不需要增加参