【深度学习】global pooling (全局池化)

JNingWei

已于 2023-01-25 16:05:15 修改

阅读量5.5w

点赞数 39

分类专栏：深度学习文章标签：深度学习人工智能计算机视觉

于 2018-04-24 14:53:19 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jningwei/article/details/80064451

版权

深度学习专栏收录该内容

79 篇文章

订阅专栏

本文解释了全局池化(global pooling)的概念及其在深度学习中的应用。全局池化是一种特殊的池化方法，其窗口大小与特征图大小相同，可以将任意大小的特征图转换为固定大小的输出，通常用于简化计算并减少参数数量。文中还介绍了全局池化的具体实现方法，包括全局平均池化和全局最大池化。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

今天看SPPNet论文时，看到“global pooling”一词，不是很明白是啥概念。上网查了一下定义，在StackOverflow
上找到了答案：
这里写图片描述

具体回答如下：
这里写图片描述

说白了，“global pooling”就是pooling的 滑窗size 和整张feature map的size一样大。这样，每个 $W\times H\times C$ 的feature map输入就会被转化为 $1\times 1\times C$ 输出。因此，其实也 等同于每个位置权重都为 $1/(W\times H)$ 的 FC层操作 。

等同于输入一个tensor，输出一根vector。

“global pooling”在滑窗内的具体pooling方法可以是任意的，所以就会被细分为“global avg pooling”、“global max pooling”等。

由于传统的pooling太过粗暴，操作复杂，目前业界已经逐渐放弃了对pooling的使用。替代方案 如下：

采用 Global Pooling 以简化计算；
增大conv的 stride 以免去附加的pooling操作。

tf实现

由于输入tensor的shape为[n, h, w, c]，那么直接对第1、2维（h、w）用tf.reduce_mean求均值即可：

net = tf.reduce_mean(net, [1, 2], name='global_pool', keep_dims=True)

[1] What does global pooling do?
[2] Global average Pooling
[3] How do I do global average pooling in TensorFlow?
[4] tf.reduce_mean实现global average pooling（全局均值池化）

评论 10

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。