一、傅里叶变换
二、Gabor核与Gabor特征
2.1 一维Gabor核
2.1.1 一维傅里叶变换
一维傅里叶变化定义如下:
f(t)
为输入信号,以t为自变量,随时间变化,是时域信号
ω
表示分解得到的各个波的频率
f̂ (ω)
表示傅里叶变换后的信号,描述了信号值随频率的变化。
2.1.2 一维高斯函数
试一下:
2.1.2 一维 Gabor 核
一维Gabor核由一个高斯核与一个复数波的乘积定义:
其中,
这里, f0 是复数波 s(t) 的频率。
将复数波 s(t)=ei(2πf0t) 代入 ??? 式中,得到:
上面最后一步得到了 Gabor 核的复数表示,我们就可以按实部和虚部将其拆分为实核和虚核,在很多应用中,我们只需要应用 Gabor核的实数部分即可:
2.1.3 Gabor 核的傅里叶变换
将 Gabor 核(式
???
)套入一维傅里叶变换(式
???
)中,得到 Gabor 核的傅里叶变换:
上式中出现了
ω̂ (f−f0a)
的形式,这里需要补充高斯核一个很有趣的性质:
ω̂ (f)=ω(f)=e−πf2
,这个性质这里就不证明了,有兴趣的同学可以自己推导一下。根据这个性质,上式中的
ω̂ (f−f0a)
也可以写作
ω(f−f0a)
,二者可以自由转换。
此外,
???
式中的末尾,我们知道了Gabor核傅里叶变换后是这样一个形式:
kaeiθω̂ (f−f0a)
,这个形式可以看做是一个复数波,它的幅度
也就是说,Gabor核相当于在频率域应用了一个高斯核窗口。假设我们这时有了一个信号的频率域: fin(f) ,那么我们直接用频率域的Gabor核 Gabor^ 与其相乘,就实现了对 f0 频率邻域范围内的滤波效果:输入信号频率离这个 Gabor 核的 f0 越远,则乘上Gabor核之后的结果就越小,尤其是当 fin 在 f0 的 3σ 区间外时,这个频率几乎可以忽略不计。于是,最终能保留下来的信号就都是 f0 频率附近的信号了。
这个想法,用公式表示出来就是:
从这个角度出发,给我们任意一个输入信号,我们先用傅里叶变换将其变换到频率域得到 fin^ ,再用 Gabor 核的傅里叶变换结果与之相乘,就是频域滤波的结果了。
不过我们大可不必这么麻烦,因为有卷积定理:
这样看来,我们只需要用 Gabor 核和输入信号卷积就可以得到输入信号在某频率邻域附近的响应结果!!
我们既可以用这个响应结果来实现频域滤波,又可以用它来描述信号的频率信息。下面要提到的Gabor特征,就是用Gabor核来描述信号的频率信息,从而作为信号的特征的。
2.2 二维 Gabor 变换
将上面的一维情况推广至二维:
2.2.1 二维傅里叶变换:
二维傅里叶变换定义如下:
为了简洁,改用 (u0,v0) 来代替 (ξx,ξy) ,则上式可写为:
提醒一下,这里 (x,y) 表示空域坐标, (u0,v0) 表示频域坐标。
2.2.2 二维复数波
二维复数波完整定义如下(用复指数形式表示):
由于初始相位对Gabor核影响不大,因此可以将其省略,得到更简洁的形式(论文中关于 Gabor 函数的定义各不一样,主要是这些细节的考虑不同):
2.2.3 二维高斯函数
二维高斯函数定义如下:
其中, σx,σy 分别为两个方向上的尺度参数(scaling parameters),用来控制高斯函数在两个方向上的“展布”形状。 (x0,y0) 为高斯函数的中心点。 K 为常数。
考虑全面的话,高斯函数还要有(顺时针)旋转,即:
加入旋转参数后的二维高斯函数为:
上图即是一个二维高斯核的图像,该高斯核中, (x0,y0)=(0,0) , (σ2x,σ2y)=(50,40) , θ=−45°
从图像可以看出, σx和σy 分别控制了高斯两个方向的“展布”情况。
2.2.4 Gabor 滤波器核
类似一维 Gabor 核,我们将二维高斯函数与二维复数波相乘,就得到了二维的Gabor核:
它的各个参数含义如下:
(x0,y0) : 高斯核的中心点
θ : 高斯核的旋转方向(顺时针)
(σx,σy) : 高斯核两个方向上的尺度
(u0,v0) : 频域坐标
K <script type="math/tex" id="MathJax-Element-113">K</script>: 高斯核的幅度(magnitude)的比例
上图为Gabor核在频率域中的图示,这个Gabor核就是从之前那个高斯核得到的,其参数分别为:$u_0 = v_0 = 1/80$,$x_0 = y_0 = 0$,$\sigma_x^2 = 50$,$\sigma_y^2 = 40$,$\theta = -45°$,$F_0 = \sqrt{2}/80$,$\omega_0=45°$。
上图为Gabor核在空间域中的图示,参数和上面那个Gabor核一样。图像左边是实部,右边是虚部。这样的Gabor核与图像进行卷积,我们便能得到图像在$(u_0, v_0)$频率附近的响应情况。在图像处理中,通常使用Gabor的实部进行卷积就可以。
三、Gabor 核作为图像特征
通过上面的分析,我们知道了,一个Gabor核能获取到图像某个频率邻域的响应情况,这个响应结果可以看做是图像的一个特征。那么,我们如果用多个不同频率的Gabor核去获取图像在不同频率邻域的响应情况,最后就能形成图像在各个频率段的特征,这个特征就可以描述图像的频率信息了