池化层
QA:
- 池化层在语义上放在卷积层后面
- 池化层在实际使用中越来越少
- 池化层使得对位置信息不那么敏感,并利用stride减少计算量。在实际中,数据会被放大增强使得卷积层对位置的敏感不至于那么大,卷积层也可用stride减少计算,所以池化层逐渐被淡化。
代码
实现池化层的正向传播
无通道、步幅池化层的实现
import torch
from torch import nn
from d2l import torch as d2l
# 池化层
def pool2d(X, pool_size, mode='max'):
p_h, p_w = pool_size
Y = torch.zeros((X.shape[0] - p_h + 1,X.shape[0]-p_w+1))
#行迭代
for i in range(Y.shape[0]):
#列迭代
for j in range(Y.shape[1]):
if mode=='max':
Y[i,j] = X[i:i+p_w,j:j+p_w].max()
elif mode=='avg':
Y[i,j] = X[i:i+p_w,j:j+p_w].mean()
return Y
验证二维最大池化层的输出
X = torch.tensor([[0.0,1.0,2.0],[3.0,4.0,5.0],[6.0,7.0,8.0]])
pool2d(X,(2,2),'max')
验证平均池化层
pool2d(X,(2,2),'avg')
调用填充和步幅
x = torch.arange(16,dtype=torch.float32).reshape((1,1,4,4))
x
深度学习框架中的步幅与池化窗口大小相同
# 3*3的窗口
pool2d = nn.MaxPool2d(3)
pool2d(x)
# 3*3的窗口
pool2d = nn.AvgPool2d(3)
pool2d(x)
设定一个任意大小的矩形池化窗口,并指定填充和步幅的高 宽
pool2d = nn.MaxPool2d((2,3),padding=(1,1),stride=(2,3))
pool2d(x)
池化层在每个输入通道上单独运算
#tensor.cat 等维拼接,必选拼接维度
X = torch.cat((x,x+1),1)
pool2d = nn.MaxPool2d(3,padding=1,stride=2)
pool2d(X)