论文的下载地址:https://arxiv.org/abs/1511.03339v2
论文的中心思想:将注意力机制用到多分辨率输入的语义分割网络中。
注意力机制其实就是对feature map做加权,且加权的权重在训练的时候学习的。
很多语义分割网络融合了多尺度(多分辨率)的特征,但方法不尽相同。一种常见的结构是SPP(Spatial Pooling Pyramid),另一种方法则是使用不同分辨率的分支。不同分辨率的分支有三种,最简单就是输入不同分辨率的图像然后通往不同的分支,另外两种如下图: