双线性池化_卷积神经网络中的各种池化操作

最新推荐文章于 2024-06-01 09:57:54 发布

Easonxxy

最新推荐文章于 2024-06-01 09:57:54 发布

阅读量1.3k

点赞数

文章标签：双线性池化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39822147/article/details/111483112

版权

池化操作(Pooling)是CNN中非常常见的一种操作，Pooling层是模仿人的视觉系统对数据进行降维，池化操作通常也叫做子采样(Subsampling)或降采样(Downsampling)，在构建卷积神经网络时，往往会用在卷积层之后，通过池化来降低卷积层输出的特征维度，有效减少网络参数的同时还可以防止过拟合现象。

主要功能有以下几点：

抑制噪声，降低信息冗余

提升模型的尺度不变性、旋转不变形

降低模型计算量

防止过拟合

一提到池化操作，大部分人第一想到的就是maxpool和avgpool，实际上还有很多种池化操作。

大部分pooling操作满足上图的模型，假设输入大小为\(i\), 输出大小为\(o\), kernel size简称\(k\), stride简称\(s\)，满足以下公式：

\[o=\lfloor\frac{i-k}{s} \rfloor+1

\]

1. 最大/平均池化

最大池化就是选择图像区域中最大值作为该区域池化以后的值，反向传播的时候，梯度通过前向传播过程的最大值反向传播，其他位置梯度为0。

使用的时候，最大池化又分为重叠池化和非重叠池化，比如常见的stride=kernel size的情况属于非重叠池化，如果stride

重叠池化一个应用的例子就是yolov3-tiny的backbone最后一层，使用了一个stride=1, kernel size=2的maxpool进行特征的提取。

>>> import torch

>>> import torch.nn.functional as F

>>> input = torch.Tensor(4,3,16,16)

>>> output = F.max_pool2d(input, kernel_size=2, stride=2)

>>> output.shape

torch.Size([4, 3, 8, 8])

>>>

平均池化就是将选择的图像区域中的平均值作为该区域池化以后的值。

>>> import torch

>>> import torch.nn.functional as F

>>> input = torch.Tensor(4,3,16,16)

>>> output = F.avg_pool2d(input, kernel_size=2, stride=2)

>>> output.shape

torch.Size([4, 3, 8, 8])

>>>

2. 随机池化

Stochastic pooling如下图所示，特征区域的大小越大，代表其被选择的概率越高，比如左下角的本应该是选择7，但是由于引入概率，5也有一定几率被选中。

下表是随机池化在CIFAR-10上的表现，可以看出，使用随机池化效果和采用dropout的结果接近，证明了其有一定防止过拟合的作

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
双线性池化_卷积神经网络中的各种池化操作

池化操作(Pooling)是CNN中非常常见的一种操作，Pooling层是模仿人的视觉系统对数据进行降维，池化操作通常也叫做子采样(Subsampling)或降采样(Downsampling)，在构建卷积神经网络时，往往会用在卷积层之后，通过池化来降低卷积层输出的特征维度，有效减少网络参数的同时还可以防止过拟合现象。主要功能有以下几点：抑制噪声，降低信息冗余提升模型的尺度不变性、旋转不变形降低模型...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。