机器学习入门（18）— 卷积网络中的池化层实现

最新推荐文章于 2023-12-31 01:49:14 发布

wohu007

最新推荐文章于 2023-12-31 01:49:14 发布

阅读量564

点赞数 2

分类专栏： Machine Learning

本文链接：https://blog.csdn.net/wohu1104/article/details/107094887

版权

Machine Learning 专栏收录该内容

29 篇文章 50 订阅

订阅专栏

1. 池化层实现

池化层的实现和卷积层相同，都使用 im2col 展开输入数据。不过，池化的情况下，在通道方向上是独立的，这一点和卷积层不同。具体地讲，如图 7-21 所示，池化的应用区域按通道单独展开。

像这样展开之后，只需对展开的矩阵求各行的最大值，并转换为合适的形状即可（图7-22）。
图 7-22
上面就是池化层的 forward 处理的实现流程。下面来看一下实现示例。

class Pooling:
    def __init__(self, pool_h, pool_w, stride=1, pad=0):
        self.pool_h = pool_h
        self.pool_w = pool_w
        self.stride = stride
        self.pad = pad
        
        self.x = None
        self.arg_max = None

    def forward(self, x):
        N, C, H, W = x.shape
        out_h = int(1 + (H - self.pool_h) / self.stride)
        out_w = int(1 + (W - self.pool_w) / self.stride)
		
		# 展开
        col = im2col(x, self.pool_h, self.pool_w, self.stride, self.pad)
        col = col.reshape(-1, self.pool_h*self.pool_w)
		
		# 最大值
        arg_max = np.argmax(col, axis=1)
        out = np.max(col, axis=1)

		# 转换
        out = out.reshape(N, out_h, out_w, C).transpose(0, 3, 1, 2)

        self.x = x
        self.arg_max = arg_max

        return out

    def backward(self, dout):
        dout = dout.transpose(0, 2, 3, 1)
        
        pool_size = self.pool_h * self.pool_w
        dmax = np.zeros((dout.size, pool_size))
        dmax[np.arange(self.arg_max.size), self.arg_max.flatten()] = dout.flatten()
        dmax = dmax.reshape(dout.shape + (pool_size,)) 
        
        dcol = dmax.reshape(dmax.shape[0] * dmax.shape[1] * dmax.shape[2], -1)
        dx = col2im(dcol, self.x.shape, self.pool_h, self.pool_w, self.stride, self.pad)
        
        return dx

最大值的计算可以使用 NumPy 的 np.max 方法。np.max 可以指定 axis 参数，并在这个参数指定的各个轴方向上求最大值。比如，如果写成 np.max(x, axis=1)，就可以在输入 x 的第 1 维的各个轴方向上求最大值。

wohu007

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
机器学习入门（18）— 卷积网络中的池化层实现

1. 池化层实现池化层的实现和卷积层相同，都使用 im2col 展开输入数据。不过，池化的情况下，在通道方向上是独立的，这一点和卷积层不同。具体地讲，如图 7-21 所示，池化的应用区域按通道单独展开。像这样展开之后，只需对展开的矩阵求各行的最大值，并转换为合适的形状即可（图7-22）。上面就是池化层的 forward 处理的实现流程。下面来看一下实现示例。class Pooling: def __init__(self, pool_h, pool_w, stride=1, pad=0)
复制链接

扫一扫

专栏目录