PSPNet 算法笔记

最新推荐文章于 2023-07-26 16:37:51 发布

AI之路

最新推荐文章于 2023-07-26 16:37:51 发布

阅读量2w

点赞数 6

分类专栏：深度学习计算机视觉分割-instance/semantic segment

本文链接：https://blog.csdn.net/u014380165/article/details/83869175

版权

PSPNet通过全局均值池化和特征融合增强上下文信息，解决了FCN的误分割问题。在PASCAL VOC2012上达到82.6%的mIOU，是语义分割的先进算法。

摘要由CSDN通过智能技术生成

论文：Pyramid Scene Parsing Network
论文链接：https://arxiv.org/abs/1612.01105

Pyramid Scene Parsing Network（PSPNet）是CVPR2017上关于场景解析的文章，拿到了2016年ImageNet比赛中scene parsing任务的冠军，当然也常用来做语义分割。这篇文章出发点是在语义分割算法中引入更多的上下文信息（context information），这样能够避免许多误分割，这些误分割可以参考Figure2，PSPNet在FCN算法的基础上引入更多上下文信息是通过全局均值池化操作（global average pooling）和特征融合实现的，因此特征呈金字塔结构，这也是论文名叫pyramid的原因。PSPNet算法是目前应用比较广泛的语义分割算法之一，该算法在PASCAL VOC2012测试集上的mIOU是82.6%。

Figure2是FCN算法的误分割示例和PSPNet的分割结果对比，因为PSPNet是在FCN的基础上做改进，因此这组图片是对比二者的分割效果，从而引出优化点的设计。第一行中FCN算法误将船分割成车，显然一辆车在水上的概率是很小的，这种是属于明显不匹配的误分割。第二行中FCN算法误将摩天大厦分割成建筑物，摩天大厦和建筑物这两个类别本身是比较接近的，这种是属于类别相近的误分割，这部分个人认为是和数据集相关的。第三行中FCN算法误将枕头分割成床，枕头本身区域较小，而且纹理和床较为接近，这种是属于难以觉察的误分割。作者认为这些误分割都可以通过引入更