【池化选择】全局最大池化和全局平均池化的实验分析

最新推荐文章于 2024-05-25 21:09:06 发布

JianqiuChen

最新推荐文章于 2024-05-25 21:09:06 发布

阅读量6.4k

点赞数 2

分类专栏：图像检索语义分割细颗粒检测文章标签：计算机视觉深度学习自动驾驶

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/JianqiuChen/article/details/106035069

版权

细颗粒检测同时被 3 个专栏收录

3 篇文章 0 订阅

订阅专栏

2 篇文章 0 订阅

订阅专栏

2 篇文章 9 订阅

订阅专栏

根据MIT的 Learning Deep Features for Discriminative Localization论文中的描述，在使用类响应图class activation mapping (CAM) 对比全局平均池化Global average pooling (GAP) vs 全局最大池化global max pooling (GMP):

类响应图示例：
在这里插入图片描述
图中高亮区域就是根据label的注意图高响应区域

具体得到的这个相应区的方法是

在这里插入图片描述
1）训练主干网络得到特征图
2）进行全局池化（图中用的GAP，也可以使用GMP）
3）对全局池化的结果做全连接得到全连接参数 w
4）把全连接参数作为权重对特征图进行加权求和上图最下方的公式

根据对图像的研究发现，不同的类别的特征图相应区域不一样，原始的卷积网络具有一定的定位能力。而且如下图所示，不同类别的注意力区域也大不相同也呈现出非常准确的特征区域。

模型可以预测出不同类别概率，根据类注意图发现。即使是错误预测的类别，比如上图预测狗狗预测成了人，但是人也在图中特征区域也是定位在了人的身上。

说了这么多就是论证GAP和GMP具有定位能力。那么具体那个好呢

先看一组实验
在这里插入图片描述

我们发现相比GAP，GMP在同一个类别上的top1 和top5 的损失都有所升高。

原因分析：
GAP 是对全局求平均，GAP LOSS 促使网络区分辨每个类别的程度，找到所有的目标可区分区域进行预测。
GMP 是对全局求最大，只去找分数最高的那个区域。而去忽略其他分数低的区域

因此在定位方面，GAP 比GMP要好

GAP outperforms GMP for localization.

关注

2
点赞
踩
17

收藏

觉得还不错? 一键收藏
1
评论
【池化选择】全局最大池化和全局平均池化的实验分析

根据MIT的 Learning Deep Features for Discriminative Localization论文中的描述，在使用类响应图class activation mapping (CAM) 对比全局平均池化Global average pooling (GAP) vs 全局最大池化global max pooling (GMP):类响应图示例：...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。