Laplacian Pyramid Reconstruction and Refinement for Semantic Segmentation论文解读

最新推荐文章于 2024-08-02 18:10:42 发布

心态已炸_沉迷学习

最新推荐文章于 2024-08-02 18:10:42 发布

阅读量1.6k

点赞数 2

本文链接：https://blog.csdn.net/zym19941119/article/details/80840282

版权

本文深入探讨了空间信息与语义信息在语义分割中的应用，提出通过学习基础函数进行图像重构，以及利用拉普拉斯金字塔细化方法，显著提升了分割的准确性和边缘清晰度。通过数据适应的基础函数，网络能够更好地恢复空间信息，同时通过残差学习实现低分辨率分割结果的锐化，以获得更精确的分割输出。

摘要由CSDN通过智能技术生成

Introduction

这篇文章介绍了空间信息与语义信息的原则并提出两种方法显著提高了分割的结果：
首先，文章提出池化破坏了通道内部的空间信息，因为池化之前的卷积可以认为其融合了多个通道空间信息并编码得到高维向量。当然这个问题大家都知道。越低的层得到的分割边缘越清晰位置越明确分辨率也越高，但很多错误分类结果；而高层得到的分割则更正确但边缘也更模糊，不够锐利。于是文章使用了一种data-adapted的基础函数来做上采样，使性能得到了显著提高。
深层特征与浅层特征
随后，文章认为相比于以前通过拼接或是相加对于空间信息的恢复与跨层的信息融合都不太好。拼接会来带特征向量的高纬度，也即会使通道的数量显著增加，而加法并不能很好地利用起空间与语义信息的相关性，并不是一个很好的trade-off，因为高分辨率的预测结果会因感受野过小而存在很多噪声预测或者说错误预测，文章发现相比于底层的语义信息，高分辨率的预测结果对最终的预测几乎没有什么影响，因为其大部分内容都被神经网络选择性忽略。
于是文章受到ResNet思想的影响，使用网络去学习残差分割，即利用底层的高分辨率分割结果去学习如何锐化高层的低分辨率结果，使其边缘更加接近真实分割。