金字塔池化模型PPM-Pyramid pooling module

最新推荐文章于 2024-05-08 23:41:38 发布

阿委困的不能行

最新推荐文章于 2024-05-08 23:41:38 发布

阅读量1w

点赞数 7

原文链接：https://blog.csdn.net/wd18508423052/article/details/93882113

版权

总结：ppm是以一种特殊的池化模型。通过由多到少的池化，可以有效增大感受野，增大全局信息的利用效率。
原文链接：https://blog.csdn.net/wd18508423052/article/details/93882113

Pyramid pooling 方法出自 2017CVPR,原文地址https://arxiv.org/pdf/1612.01105.pdf

该文的一大贡献就是Pyramid pooling module(简称PPM)

1. PPM有什么用

一般可以粗略地认为感受野就是使用上下文信息的大小。在很多网络中，我们都很重视全局信息的获取。在FCN中，就是没有充分的场景的上下文信息，导致在一些不同尺度的物体分割上处理不好。

没有充分利用好场景的上下文信息就会有这些问题(分别如上图所示)：

（1）Mismatched Relationship

（2）Confusion Categories

（3）Inconspicuous Classes

总之，PPM就是一种相对较好的充分利用全局信息的方式。这种保留全局信息的思路其实与ASPP(Atrous Spatial Pyramid Pooling) 很相似。从直觉上来看，这种多尺度的pooling确实是可以在不同的尺度下来保留全局信息，比起普通的单一pooling更能保留全局上下文信息。

2 PPM的结构

下面描述下PPM的过程。

原文中采用4种不同金字塔尺度，金字塔池化模块的层数和每层的size是可以修改的。论文中金字塔池化模块是4层，每层的size分别是1×1,2×2,3×3,6×6。

首先，对特征图分别池化到目标size，然后对池化后的结果进行1×1卷积将channel减少到原来的1/N,这里N就为4。接着，对上一步的每一个特征图利用双线性插值上采样得到原特征图相同的size，然后将原特征图和上采样得到的特征图按channel维进行concatenate。得到的channel是原特征图的channel的两倍，最后再用1×1卷积将channel缩小到原来的channel。最终的特征图和原来的特征图size和channel是一样的。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。