代码地址:PSPNet
1. 概述
导读:这篇文章使用不同的金字塔池化模块从利用特征全局分类的角度在FCN网络的基础上提出了金字塔分割网络(Pyramid Scene Parsing Network, PSPNet),该网络能够使用全局与局部的信息用于产生最后较高质量的分割。此外,文章还提出了deeply supervised loss来更好优化分割网络(主干网络上的辅助损失函数)。文章提出的PSPNet在VOC-2012数据集上达到85.4,CityScapes数据集上达到80.2。
文章的主要贡献:
- 1)提出了PSPNet,它将困难的场景上下特征嵌入到基于FCN网络中;
- 2)对于ResNet基于deeply supervised loss提出了有效优化策略;
- 3)构建了一个state-of-art的语义分割系统;
下面是使用文章提出的方法进行分割得到的分割示例:
现有分割网络存在的一些问题,如下图所示:
1. Mismatched Relationship
对于一个物体其存在的位置是有其规律的,比如图2第一行中所示的,一辆车是很少会出现在河面上的,这是由于缺少上下文的信息导致错误分类概率增加导致的;
2. Confusion Categories
对于一些具有相似属性的目标会在分割网络结果中存在混淆的现象,如图2中第二行所示。这个问题可以使用类间的关系进行解决;
3. Inconspicuous Classes
对于一些较小的目标在分割任务中难以找到&