Pyramid pooling 方法出自 2017CVPR,原文地址https://arxiv.org/pdf/1612.01105.pdf
该文的一大贡献就是Pyramid pooling module(简称PPM)
1. PPM有什么用
一般可以粗略地认为感受野就是使用上下文信息的大小。在很多网络中,我们都很重视全局信息的获取。在FCN中,就是没有充分的场景的上下文信息,导致在一些不同尺度的物体分割上处理不好。
没有充分利用好场景的上下文信息就会有这些问题(分别如上图所示):
(1)Mismatched Relationship
(2)Confusion Categories
(3)Inconspicuous Classes
总之,PPM就是一种相对较好的充分利用全局信息的方式。这种保留全局信息的思路其实与ASPP(Atrous Spatial Pyramid Pooling) 很相似。从直觉上来看,这种多尺度的pooling确实是可以在不同的尺度下来保留全局信息,比起普通的单一pooling更能保留全局上下文信息。