40.图像卷积

最新推荐文章于 2025-04-05 13:00:00 发布

哈哈拉拉hxl

最新推荐文章于 2025-04-05 13:00:00 发布

阅读量944

点赞数 18

分类专栏：动手学深度学习文章标签：算法

本文链接：https://blog.csdn.net/qq_41238579/article/details/140412231

版权

动手学深度学习专栏收录该内容

27 篇文章

订阅专栏

在之前的课程中，我们研究了全连接层（Fully Connected Layer）的主要问题，进而引出了图像卷积的概念。本节课将详细介绍什么是图像卷积，并从数学运算的角度来理解这一重要的深度学习工具。

什么是卷积运算？

卷积（Convolution）是一种数学运算，广泛应用于信号处理和图像处理领域。基本思想是两个函数的积，通过滑动窗口的方式计算它们的叠加值。对于一维情况下，假设 \( f \) 和 \( g \) 分别表示输入的两个函数，其中 \( f \) 是输入函数， \( g \) 是卷积核函数，卷积运算的符号表示为：

\[ (f * g)(t) = \int_{-\infty}^{\infty} f(\tau) g(t - \tau) \, d\tau \]

对于二维情况，卷积运算略微复杂，有两个变量 \( x \) 和 \( y \)。卷积的基本思想可以通过如下公式表达：

\[ (f * g)(x, y) = \int_{-\infty}^{\infty} \int_{-\infty}^{\infty} f(\tau, \eta) g(x - \tau, y - \eta) \, d\tau \, d\eta \]

图像卷积的直观理解

在图像处理领域，卷积运算通常用于特征提取和图像过滤。例如，在对图像进行卷积操作时，输入函数 \( f \) 表示输入图像，卷积核函数 \( g \) 是一个小窗口（通常称为滤波器或核）。卷积的输出称为特征图（Feature Map）。通过在输入图像上滑动卷积核，并对每个位置进行元素相乘和求和操作，生成输出图像。

卷积神经网络的发展

图像卷积的概念最早可以追溯到1962年，两位诺贝尔奖获得者在研究猫的视觉皮层特点时提出的。他们发现视觉系统的神经元对特定的条纹反应最为强烈。这一发现启发了杨乐坤等人在1998年提出卷积神经网络（CNN），并将其应用于手写数字识别，取得了显著的效果。卷积神经网络自此在计算机视觉和深度学习领域得到了广泛的应用。