文章目录
论文题目:Progressive Semantic Segmentation(渐进式语义分割)
四个问题
-
要解决什么问题?
对高分辨率的图像,但是不能使GPU内存超载或丢失输出的分割图中的精细细节。
-
问题提出的动机
a.内存的限制意味着必须对高分辨率的图像进行降采样,这种方法的弊端会造成丢失细节;
b.将图像分成局部patches进行单独处理,这种方法由于缺乏全局图,可能会产生歧义。 -
提出了什么新的方法?
这篇文章提出了MagNet,一个多尺度的框架,通过在多个放大级别上观察图像来解决局部的模糊性。MagNet有多个处理阶段,其中每个阶段对应于一个放大级别,而一个阶段的输出被送入下一个阶段,进行粗到细的信息传播。每一阶段都以比前一阶段更高的分辨率分析图像,恢复先前由于降采样步骤而丢失的细节,并且分割输出通过各处理阶段逐步完善。
-
效果如何?
在 urban views, aerial scenes, and medical images的三个高分辨率数据集上进行的实验表明,MagNet的性能始终优于其他方法。
1.介绍
目前最先进的语义图像分割技术是基于深度学习,其中一个卷积神经网络(CNN)接受一个输入图像并输出一个分割图。然而,现有的大多数技术都假定整个分割过程可以通过对输入图像的单一前馈传递来完成,并且整个过程可以装入GPU内存。遗憾的是,由于内存和其他计算限制,大多数现有技术无法处理高分辨率的输入图像。目前处理大型图像的方法有以下两种。
a.图像进行降采样;
b.将图像分成局部patches进行单独处理。
前一种方法会造成细节丢失,后一种方法由于缺乏全局图,可能会产生歧义。
解决上述两种方法的局限性的一种方法是将它们结合起来,即融合全局和局部分割过程。一方面,整个图像的全局视图可以用来解决局部patches