Strip Pooling: Rethinking Spatial Pooling for Scene Parsing
https://arxiv.org/pdf/2003.13328.pdfarxiv.org一 文章出发点
按照作者所说:普通的空间池化,不可避免的会加入一些无关紧要的像素区域。尤其是在利用池化扩大感受野时,这一缺点将更加明显。所以作者提出了 条纹池化。
![c868d79be8156b7c5774787c596644dd.png](https://i-blog.csdnimg.cn/blog_migrate/5c4f7a4e4165752486d8e9dc06b98ab4.jpeg)
二、文章核心思想
文章的核心思想非常简单, 也很好理解。见下图。条纹池化,就是一排(非整排)像素或一列像素内部做池化。
![c399f411ba5b1e01bea8bcc7164183ba.png](https://i-blog.csdnimg.cn/blog_migrate/926d53c682aac470fbc3f76edb8bd255.jpeg)
可以看出,使用条纹池化后,显著改善了柱形形状物体的分割效果。
三 怎么用
上述条纹池化实现也很简单,(这可能时我见过最简单思想的CVPR 了,有时候很简单的思想,怎么把它描述的好用也是一门技巧。)所以重点在于作者怎么用的。
作者 主要把这个条纹池化用来做长距离依赖建模了,为此构建了两个模块
一个SPM(Strip Pooling Module) 用来代替全局池化
![c9f141807cfb00c94ac83ed760f0e331.png](https://i-blog.csdnimg.cn/blog_migrate/de2d0049a49f8f9313ef2737cc58449a.jpeg)
一个Mixed Pooling Module(MPM) 用来代替金字塔
![c3f65b0b6a0540267e473657a4f747f8.png](https://i-blog.csdnimg.cn/blog_migrate/2e0e7f9c3281d4bb984c32128a5e7fdc.jpeg)
上述两个模块替代的原则以及有效的原因在于:
对于某一空间位置而言,全局池化或者金字塔池化时会包含对这一位置预测无用甚至误导的信息(有时信息太多就会出现:公说公有理,婆说婆有理)。所以有必要限制池化的区域,所以条纹池化这种限制大区域池化可以起到有效的效果。
其它具体实现感兴趣的自读。