论文地址:[1605.02264] Laplacian Pyramid Reconstruction and Refinement for Semantic Segmentation
题目:Laplacian Pyramid Reconstruction and Refinement for Semantic Segmentation
作者:Golnaz Ghiasi and Charless C. Fowlkes
单位:Dept. of Computer Science, University of California, Irvine
这是ECCV2016的一篇文章,主要研究了CNN层次结构的空间信息与语义信息的原则,并介绍了两种可显著改善分割效果的技术:
第一,低分辨率的高层特征是否丢失了大量的空间位置信息。因为池化之前的卷积操作融合了多个通道空间信息并编码到高维向量,而池化操作使空间分辨率缩小。比如,越低的层得到的分割边缘越清晰位置越明确分辨率也越高,但很多错误分类结果;而高层得到的分割则更正确但边缘也更模糊,不够锐利。针对这一点,作者提出一种reconstruction模块代替直接的上采样,使用更大的kernel size来获取更多信息。
第二,不同层特征融合方法的问题。拼接会来带特征向量的高维度,也会使通道的数量显著增加