感谢很多人对卷积这个概念的科普,最后总结起来,卷积的本质真的很简单,就是定义了一种运算,就像加减乘除一样:
卷 积 = 线 性 乘 加 卷积=线性乘加 卷积=线性乘加
卷积的本质
在理解前,要明确一点的是,就跟加减乘除一样,卷积运算一定是由于在现实科学研究中某一些特定的场景下出现了这种运算需求才相应出现的定义。这里给出一个工科生的理解方式,首先看卷积公式:
y
(
t
)
=
∫
−
∞
+
∞
x
(
p
)
×
h
(
t
−
p
)
d
p
=
x
(
t
)
⊗
h
(
t
)
y(t)=\int_ { - \infty }^{ + \infty }x(p)\times h(t-p)dp=x(t)\otimes h(t)
y(t)=∫−∞+∞x(p)×h(t−p)dp=x(t)⊗h(t)
所以,拆开公式来看,要理解的地方有
×
\times
×和
∫
\int
∫两处。
- 为什么要
×
\times
×呢?
整个公式最后从自变量 p p p转成了自变量 t t t,所以我们不妨固定 t t t,然后去理解里面到底在发生什么。里面的 p p p一直在变化,从 x ( p ) x(p) x(p)的角度来看, x ( p ) x(p) x(p)也在一起跟着变化。作为 x ( p ) x(p) x(p)的算子, h ( t − p ) h(t-p) h(t−p)也在跟着一起变化,即:不同 x ( p ) x(p) x(p)被按照一定规则 h h h匹配上了不同的系数。 - 为什么要
∫
\int
∫呢?
将问题1中不同的 x ( p ) x(p) x(p)匹配上不同的算子之后求和会得到什么呢?
在傅里叶变换中,不同的算子即是一个该时刻下由 s i n sin sin和 c o s cos cos张成的函数空间,原始函数 x ( p ) x(p) x(p)与 s i n sin sin、 c o s cos cos内积投影,这样与该频率 ω \omega ω(就是1中我们固定的 t t t)越为相似的 x ( p ) x(p) x(p)组分系数越高,最后一求和便可提取出 x ( p ) x(p) x(p)频率为 ω \omega ω的分量1。滤波的道理亦是如此。在图像二维卷积中指定一个kernel,每个kernel格子中赋予不同的权值,之后再相乘求和即可提取该图片局部下符合kernel属性的信息,改变kernel的种类就类似于改变傅里叶变换的 ω \omega ω即可提取符合不同kernel属性的信息。
不用一定强调要去把时频域、傅里叶变换亦或是二维的图像卷积联系起来,不同场景下卷积公式的变化只是一些变形而已。卷积的理解最重要的就是他是一种运算,将其理解成普通加减乘除的复合高级版,并不意味加减乘除的那些算子不可更改。换句话说,当某天我们在新的场合下,遇到了先相乘后相加的形式,我们都可以称呼他为卷积。
卷积的总结
从以上角度去理解我们常说的将某个东西A(源函数)和另一个东西B(某种信息模板通过参数如
ω
\omega
ω表现出的提取规则)做卷积,其实就是将A整体上经过B模板的改造,A改造结果即是从B空间看A的结果。
“如果从这个角度处理问题太复杂的话,换一个角度试试看。”卷积就是这句话很好的数学表达。
技术本就玩具,实践方出真知。
好戏常在结尾,莫要纠结一时。