摘要
背景
空间金字塔池化(Spatial Pyramid Pooling, SPP)
网络能够通过以多种速率和多个有效视野探测输入特征或汇集操作,来编码多尺度上下文信息
有学者提出将SPP应用到卷积神经网络中,下图的上部分是传统的CNN结构,下部分是应用了SPP池化CNN结构。这个卷积层可以接受任意大小的输入,但是经过SPP之后会产生固定大小的输出以适应全连接层,大小由SPP结构而定。
SPP的具体结构如下图所示:
Encoder-Decoder
可以通过逐渐恢复空间信息来捕捉更清晰的对象边界
本文方法
将两者的优点结合起来。
提出一个deeplab v3+的模型:通过添加一个简单而有效的Decoder模块来改进分割结果,尤其是沿着对象边界的分割结果。