Regularized Pooling

最新推荐文章于 2023-10-02 23:51:11 发布

ama_momo

最新推荐文章于 2023-10-02 23:51:11 发布

阅读量232

点赞数

分类专栏：细粒度分类文章标签：计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44529634/article/details/106613295

版权

细粒度分类专栏收录该内容

7 篇文章 7 订阅

订阅专栏

Abstract

在CNNs中pooling的作用：dimensionality reduction and deformation compensation.

但是存在问题：its excessive ﬂexibility risks canceling the essential spatial differences between classes.(过度灵活性可能会抵消类之间的本质空间差异)

提出：regularized pooling，提高了识别精度，而且加快了学习的收敛速度。

1 Introduction

motivation：

Most of the actual deformations are topology-preserving, i.e., spatially continuous within each object region; if a part of an object shifts to a certain direction, its neighboring part also shifts to a similar direction.
在这里插入图片描述

max pooling中的箭头指的是中心位置到最大值的方向，可以看到max pooling中箭头的指向比较杂乱无章。

而作者提出的regularized pooling则比较有序。

在这里插入图片描述

从可视化结果中可以看出，regularized pooling较max pooling能保留更多的结构信息。

2 Related Work

2.1 Traditional pooling operations

MP2-pooling（2x2 max pooling）、fractional max pooling (FMP) 、S3Pool、 mixed pooling 、polynomial pooling (P-pooling)

2.2 Recent pooling operations

spatial pyramid pooling(SPP）、Local Importance-based Pooling (LIP)

作者提出的池化：考虑了空间信息，调节了池化的方向，使池化在相邻内核之间均匀化。

3 Regularized Pooling

在这里插入图片描述

regularized pooling与max pooling最大的不同：不是选取一个kernel中的最大值

首先按照max pooling操作的方式计算出位移方向 $\Delta_{i,j}$
之后在平滑窗口 $w$ 内取平均得到正则化后的位移方向

公式太乱！！以下是看代码后自己理得思路：
在这里插入图片描述

在这里插入图片描述
所以最终的偏移 $(x, y) = (0, 1)$ ，即2指向7。

4 Experiment on Character Images

数据集：

MNIST：28x28，60000 train，10000test
EMNIST：37类，大小写，88800train，14800test

4.2 Experimental setup

VGG，dropout=0.25，随机初始化网络参数计算5次得到平均值，图片先resize成60x60，在pooling时no-padding

SGD，CEloss

MNIST：lr= $10^{-2}$ ，EMNIST：lr= $10^{-4}$ ，

epoch=50，batch size=100

4.3 Performance comparison with traditional pooling methods

$n = 5, w = 3, s = 5$

在这里插入图片描述

更快收敛。精度提升在这里没有很明显？

4.4 Qualitative evaluation

在这里插入图片描述

regularized pooling更好地保留了字符的形状和轮廓。

在这里插入图片描述

对于混淆的配对，规则化的配对减少了错误认知，而对于简单配对，三种配对方法没有显著差异。这些结果表明，正则化池通过抑制过度补偿来保持输入特征图的详细结构，从而有效地区分具有细微结构差异的类对。

4.5 Effect of hyper parameters

n对结果的影响比 $w$ 更显著

随着n的增加，regularized pooling与max pooling之间的差异会越来越大。因为n越大，max pooling的 over-compensation 就会越强，而regularized pooling则有效抑制了过度补偿。

在这里插入图片描述

较小的stride可以带来更好的performance。

在这里插入图片描述

5 Experiment on Texture Images

该实验主要是验证regularized pooling在哪种纹理数据集上有效。

Kylberg texture dataset ：28类，每类有160个样本，其中28x112=5376用于训练，48x28=1344用于测试

灰度图，576x576，resize成256x256，Adam，batch size=32

在这里插入图片描述

在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。