神经网络系列---池化

最新推荐文章于 2025-04-19 23:19:35 发布

-_Matrix_-

最新推荐文章于 2025-04-19 23:19:35 发布

阅读量3.4k

点赞数 22

分类专栏：深度学习文章标签：神经网络人工智能深度学习

本文链接：https://blog.csdn.net/weixin_43763292/article/details/136331077

版权

深度学习专栏收录该内容

13 篇文章

订阅专栏

本文探讨了卷积神经网络中的最大池化与平均池化，包含其工作原理、示例计算和相关代码，适用于深度学习理解。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文章目录

- 池化
- - 最大池化
  - 平均池化

池化

最大池化

最大池化（Max Pooling）是卷积神经网络中常用的一种池化技术。其操作是：在输入特征图的一个局部窗口内选取最大的值作为该窗口的输出。

数学表达式如下：

考虑一个输入特征图 $A$ ，并定义一个大小为 $\times f$ 的池化窗口和步长 $s$ 。对于输出特征图 $M$ 中的元素 $M (i, j)$ ，其值由以下公式确定：

$\max_{u=0}^{f-1} \max_{v=0}^{f-1} A(i \times s + u, j \times s + v)$

其中：

$M (i, j)$ 是输出特征图的第 $(i, j)$ 个元素。
$\max$ 表示最大值操作。
$u$ 和 $v$ 都是在 $[0, f - 1]$ 范围内变化的索引，它们用于遍历池化窗口内的每一个元素。
$s$ 是步长，定义了池化窗口在输入特征图上移动的距离。
$\times s + u, j \times s + v)$ 是输入特征图 $A$ 中与输出特征图 $M (i, j)$ 对应的局部窗口的元素。

这个公式简单地描述了最大池化的操作：对于每个输出元素 $M (i, j)$ ，都在输入特征图 $A$ 的相应局部窗口中找到最大的值。

//最大池化
Eigen::MatrixXf Pooling::maxPoolingForward(const Eigen::MatrixXf& input,int m_poolSize,int m_stride)
{
    int outputHeight = (input.rows() - m_poolSize) / m_stride + 1;
    int outputWidth = (input.cols() - m_poolSize) / m_stride + 1;

    Eigen::MatrixXf output(outputHeight, outputWidth);

    for (int i = 0; i < outputHeight; ++i)
    {
        for (int j = 0; j < outputWidth; ++j)
        {
            output(i, j) = input.block(i * m_stride, j * m_stride, m_poolSize, m_poolSize).maxCoeff();
        }
    }

    return output;
}
//最大池化 反向
Eigen::MatrixXf Pooling::maxPoolingBackward(const Eigen::MatrixXf& input, const Eigen::MatrixXf& gradient,int m_poolSize,int m_stride)
{
    Eigen::MatrixXf output = Eigen::MatrixXf::Zero(input.rows(), input.cols());

    int outputHeight = gradient.rows();
    int outputWidth = gradient.cols();

    for (int i = 0; i < outputHeight; ++i)
    {
        for (int j = 0; j < outputWidth; ++j)
        {
            int row,col;
            input.block(i * m_stride, j * m_stride, m_poolSize, m_poolSize).maxCoeff(&row,&col);
            output(i * m_stride + row, j * m_stride + col) += gradient(i, j);

        }
    }

    return output;
}

平均池化

平均池化（Average Pooling）是卷积神经网络中另一种常用的池化技术。其操作是在输入特征图的一个局部窗口内计算所有值的平均值，然后将此平均值作为该窗口的输出。

数学表达式如下：

考虑一个输入特征图 $A$ ，并定义一个大小为 $\times f$ 的池化窗口和步长 $s$ 。对于输出特征图 $M$ 中的元素 $M (i, j)$ ，其值由以下公式确定：

$\frac{1}{f \times f} \sum_{u=0}^{f-1} \sum_{v=0}^{f-1} A(i \times s + u, j \times s + v)$

其中：

$M (i, j)$ 是输出特征图的第 $(i, j)$ 个元素。
$\sum$ 表示求和操作。
$u$ 和 $v$ 都是在 $[0, f - 1]$ 范围内变化的索引，它们用于遍历池化窗口内的每一个元素。
$s$ 是步长，定义了池化窗口在输入特征图上移动的距离。
$\times s + u, j \times s + v)$ 是输入特征图 $A$ 中与输出特征图 $M (i, j)$ 对应的局部窗口的元素。
$\times f$ 是池化窗口的大小。

这个公式描述了平均池化的操作：对于每个输出元素 $M (i, j)$ ，都在输入特征图 $A$ 的相应局部窗口中计算所有值的平均值。

//平均池化
Eigen::MatrixXf Pooling::averagePoolingForward(const Eigen::MatrixXf& input,int m_poolSize,int m_stride)
{
    int outputHeight = (input.rows() - m_poolSize) / m_stride + 1;
    int outputWidth = (input.cols() - m_poolSize) / m_stride + 1;

    Eigen::MatrixXf output(outputHeight, outputWidth);

    for (int i = 0; i < outputHeight; ++i)
    {
        for (int j = 0; j < outputWidth; ++j)
        {
            output(i, j) = input.block(i * m_stride, j * m_stride, m_poolSize, m_poolSize).mean();
        }
    }

    return output;
}

// 反向传播对于平均池化比较简单，因为只需要分摊输入梯度到相应的位置。
Eigen::MatrixXf Pooling::averagePoolingBackward(const Eigen::MatrixXf& input,const Eigen::MatrixXf& gradient,int m_poolSize,int m_stride)
{
    Eigen::MatrixXf output = Eigen::MatrixXf::Zero(input.rows(), input.cols());

    int inputHeight = gradient.rows();
    int inputWidth = gradient.cols();

    for (int i = 0; i < inputHeight; ++i)
    {
        for (int j = 0; j < inputWidth; ++j)
        {
            output.block(i * m_stride, j * m_stride, m_poolSize, m_poolSize).array() += gradient(i, j) / (m_poolSize * m_poolSize);
        }
    }

    return output;
}