二维卷积层入门：卷积运算、填充与步幅、输入输出通道

最新推荐文章于 2025-03-14 19:34:00 发布

皮皮鲁同学

最新推荐文章于 2025-03-14 19:34:00 发布

阅读量1.9w

点赞数 35

分类专栏：深度学习人工智能文章标签：机器学习

本文链接：https://blog.csdn.net/qq_42596142/article/details/111467409

版权

微信公号：ilulaoshi / 原文发表在我的个人网站：https://lulaoshi.info/machine-learning/convolutional/two-dimension-convolution-layer.html
转载请引用我的个人网站链接，谢谢！

卷积神经网络（Convolutional Neural Network，CNN）在图像领域应用非常广泛。区别于普通的全连接前馈神经网络，卷积神经网络是含有卷积层（Convolutional Layer）的神经网络。本文解释二维卷积层的工作原理。

卷积的数学表示

其实计算机、电子、通信类专业的毕业生应该都对“卷积”一词有所耳闻，卷积是数字信号处理中一定会介绍的概念，但是本科毕业多年，这些基础知识早都忘光了。关于深度学习中的卷积，再次接触他就是是在Ian Goodfellow的《Deep Learning》一书中。这本书，以及曾经的本科课本中对卷积的定义都是一个非常不直观的数学公式。
$=\int_{ - \infty }^{ + \infty } f(\tau)g(n − \tau)d\tau$
这个公司表示 $f$ 和 $g$ 做卷积，似乎公式中有个乘法：即 $f(\tau)$ 和 $g(n-\tau)$ 做了个乘法。但 $n$ 和 $n-\tau$ 是什么意思似乎不太好理解。

上面公式是连续的定义，再看看离散的定义：
$=\sum_{ \tau =- \infty }^{ + \infty } f(\tau)g(n − \tau).$

相信看到这两个公式后，绝大多数朋友就想直接放弃了。但不要太丧气，卷积其实没有那么难。

互相关运算

我们从一个更为简单的角度来看：一个二维的卷积其实是两个矩阵之间的某种乘法。《动手学深度学习》举了一个例子，即图1：两个二维的矩阵做某种特殊的乘法，输出的第一个元素是这么得到的： $0\times0+1\times1+3\times2+4\times3=19$ 。也就是说，核矩阵与输入矩阵中深色部分一一相乘，再加起来。

图1 互相关运算输出第一个元素计算过程

接着，我们向右移动输入矩阵的深色部分，得到第二个输出元素。同样，计算的过程也是输入矩阵的深色部分与核一一相乘。

图2 互相关运算输出第二个元素计算过程

具体而言，输出中的各个元素是按照下面的公式计算的：
$0\times0+1\times1+3\times2+4\times3=19,\\ 1\times0+2\times1+4\times2+5\times3=25,\\ 3\times0+4\times1+6\times2+7\times3=37,\\ 4\times0+5\times1+7\times2+8\times3=43.\\$