论文链接: https://arxiv.org/abs/1709.00179
本文针对卫星图像中的小目标分割问题,通过空洞卷积构建网络
本文发现,空洞卷积卷积的简单应用并不总是提高性能,特别是,大量增加的膨胀因子不能聚集小对象的局部特征,这是内核权重间隔增加的副作用,即内核的稀疏性增加,这意味着,在分辨率和上下文方面,增加膨胀因子是重要的,但它可能会对内核的稀疏性产生不利影响如小物体。这对于遥感场景来说尤其不可取。虽然在现代视觉研究中,配备了越来越大的卷积的CNN都很流行,但对小物体的分割则需要解决。解决这个问题的方法就是 递减膨胀因子
为此提出LFE网络,网络结构如图所示
网络分为三个模块:
front-end 模块 提取覆盖大上下文的特征 扩展因子增加
为了同时满足大的接收场和高的空间分辨率,采用了膨胀卷积[3]。膨胀卷积在保持分辨率的同时扩大了接收场。
膨胀卷积利用了特定的核函数,其核大小和稀疏权的间隔随膨胀因子呈指数增长,通过增加膨胀因子,接受场也以指数方式被大核扩展。虽然以前的工作通常在输出附近的几层中使用膨胀卷积,但我们采取了更激烈的方法。具体来说,我们消除了前端模块的所有次采样层,使用了膨胀卷积。虽然这对小型建筑是有效的,但是在膨胀的核中有两个关于稀疏性的问题:(1)相邻单元间的空间一致性变弱;(2)局部结构不能在较高层中提取。这个问题将在下一个模块中解决
对于小型对象,需要在较高层提取一些本地结构,因为需要识别大的上下文。然而,随着膨胀系数的增加,由于信息金字塔的不重叠,较高层无法提取局部结构。
lfe 模块 聚合前端模块分散的局部特征 扩展因子减小
为了解决这两个问题,我们提出了减少膨胀因子的局部特征提取模块(Lfe),其主要思想是增加膨胀因子,如果在增加膨胀因子后附加具有较小膨胀因子的结构,则可以重新连接相邻单元的信息金字塔,从而逐渐恢复相邻单元之间的一致性,并在较高层提取局部结构。LFE模块被证明是有效的,特别是对于小型对象。
head模块 输出与输入相同分辨率的概率图
通过简单地对输出概率图进行阈值处理,获得单个对象实例的掩码建议。然后,对于每个掩码,计算一个对象得分作为掩码内概率值的平均值。
在所有的模型中,除最后一层外,其余的卷积层都是RELU激活的,最后一层是softmax层输出概率图,所有网络都采用76×76的输入块,16×16的中心区域输出概率图。