论文地址:APCNet:Adaptive Pyramid Context Network for Semantic Segmentation
项目代码基于Pytorch
,但尚未开源
背景
最近的研究表明结合上下文特征能够显著的提升深度语义分割模型性能。这些模型的差异仅仅在于在实际中它们构造上下文特征的方式不同。这篇文章首先介绍了语义分割任务中上下文特征的三个理想特性。作者发现尽管Global-guided Local Affinity(GLA)在构建上下文特征时起这重要作用,但是之前的研究者却往往忽略了这一点。基于此,作者提出用于语义分割的Adaptive pyramid context network,APCNet,ACPNet构造的主体是多个Adaptive Context Modules,ACMS。每个ACM利用全局图像表示作为指导估计每个区域的Affinity系数,然后计算这些上下文Affinity的上下文向量。
本文的实验在PASCAL VOC 2012、Pascal-Context、ADE20K数据集上完成。实验表明,APCNet在上述三个数据集中都取得了SOTA性能,其中在PASCAL VOC 2012测试集上class-level的mIOU为84.2%.
语义分割任务中上下文特征的三个特性:
Multi-