摘要
红外小目标探测在红外搜索和跟踪系统中起着重要的作用。然而,红外小目标图像往往对比度较低。本文提出了一种利用四元数离散余弦变换(QDCT)改进目标对比度和抑制基于时空增强的背景杂波的红外小目标检测方法。该方法有两个方面: 1)我们提出通过构造红外图像的四元数特征图来检测红外小目标。四元数集成了四种特征图,包括峰度特征、空间域可操纵滤波提取的两个方向特征图和时域运动特征。2)然后将四元数输入QDCT,通过符号函数处理得到每个特征通道的显著性映射。最终的检测结果通过与四元数的逆QDCT得到。与几种最先进的算法相比,在相同的阳性检出率下,该方法具有较低的误报率。
关键词: 红外(IR)小目标检测、峰度特征、可操纵滤波器、四元数离散余弦变换(QDCT)
1、引言
从红外(IR)监控视频中检测小目标是军事和商业领域的一个重要应用。感兴趣的目标的准确信息对于这些应用程序是必要的。然而红外目标由于成像距离长、背景复杂,目标尺寸通常在2×2~9×9像素之间,并且可能存在对比度低、信号杂波比低,缺乏颜色、形状、纹理等关键信息。这将导致相当大的误报率。因此,在复杂背景下的红外图像中检测小目标具有重要的现实意义。
图1中列出了几种常见的红外小目标图像。红外小目标的检测存在几个具体的问题,这在其他目标的检测中是看不到的。首先,背景和目标都是复杂多变的,如卷云、团云、带状云等。其次,与可见图像相比,红外图像似乎要简单得多,缺乏纹理信息、颜色信息,成像质量较差,如图1所示。纹理和颜色信息的缺乏意味着可以区分背景目标的特征较少,图像中不同部分之间的边界也不明确。此外,目标尺寸小造成的差异较小,可能导致检测错误。红外图像的这些特征在进行小目标检测时提出了很大的挑战。因此,可见图像中的常规检测方法在红外图像中不再有效,特别是在复杂场景中,有必要开发特定的红外小目标检测方法。
图1 具有代表性的红外常见背景和目标类型。( a ) Cirrus云( b )絮凝目标( c )团云( d )带状云( e )条状目标(f)陆地点目标(g)陆地弱目标(h)陆地船目标。
现有的红外小目标检测方法可大致分为空间域方法和变换域方法。空间域方法主要通过测量图像对比度来提取前景和背景之间的差异,包括基于局部对比度测量的方法、基于形态滤波的方法、基于统计回归的方法和基于人类视觉系统的方法。基于局部对比度测量的方法根据小目标区域与其周围背景区域之间的强度差计算对比度值,然后通过设置一个阈值对小目标进行分离。基于形态学滤波的方法利用形态学算子设计了一个滤波器来抑制背景滤波。基于统计回归的方法通过使用输入数据估计背景的分布或回归函数来进行检测。基于HVS的方法通过提高目标和背景之间的局部对比度来实现检测。变换域方法通常采用一种特殊的变换,如小波变换、傅里叶变换、四元数傅里叶变换(PQFT)的相位谱等。尽管计算复杂度较高,但复杂背景下的检测在变换域比在空间域中表现得更好。这些变换域方法定量地定义了变换域中目标和背景之间的频率差,并通过放大测量到的频率差来实现检测。
由于图像中更多的细节意味着变换域中的更高的相位信息值,因此通过提取相位信息可以获得良好的检测结果。据此,Qi等人利用傅里叶变换(PFT)的相位谱来增强目标。之后,Qi等人提出了一种利用四元数傅里叶变换(PQFT)相位谱检测红外小目标的新方法。在该模型中,他们使用facet模型得到四个方向性特征来执行PQFT。然后将每个PQFT特征的振幅谱值设为常值,使相位谱的相位逆变换构成显著性图。但这两种方法都只使用相位谱来恢复信号,这样会造成一些信息丢失。它也可能导致测试结果中的检测遗漏。Yang等人提出了另一种基于另外的方向特征的小目标检测方法。而该滤波器是通过高斯核函数实现的,该核函数可以在提取边缘方向特征的同时模糊原始图像。此外,与傅里叶变换相比,余弦变换只执行实偶函数,并且只包含实余弦项。它是一个实数的域转换。实际信号大多在实数域,这使得傅里叶变换非常冗余。因此,余弦变换大大降低了计算的复杂度。考虑到余弦变换的优点,提出了一种基于四元数离散余弦变换(QDCT)的基于时空增强的红外小目标检测方法。QDCT可以支持四个通道,为DCT提供更多的信息,而传统的DCT只能使用灰色信息。其动机主要是基于小目标的成像特征,通过结合不同的弱特征,可以从变换域获得更多的信息。此外,考虑到一个小目标经常使HVS具有较高的响应,红外小目标检测可以表述为一个显著的区域检测问题。了解了这一点,我们将QDCT应用于红外序列小目标检测。我们的方法利用了时间域的运动特征、峰度特征和空间域的两个方向性特征: 1)。利用运动特征图对帧间的相关性进行建模,以提高序列目标检测的有效性。 2).峰度反映了图像斑块分布与目标分布的差异,因此在目标和背景处的峰度值分别不同,有利于区分它们。 3).结合具有高斯样分布的小红外目标的各向同性特性和背景的局部方向特性,利用可操纵滤波器作为方向滤波器对输入视频的每一帧进行滤波,得到两个方向特征图。四个特征图构成了一个四元数。通过上述三个步骤,得到了输入的四元数。然后用符号函数QDCT对四元数进行处理,得到空间表示(也是四元数)。最后,利用高斯低通滤波器对该振幅谱进行滤波,得到红外小目标的最终检测结果。其中,符号函数在抑制背景和检测具有类高斯分布的重要小红外目标方面发挥了重要作用。
本文的主要贡献如下:(1)通过首次对QDCT的特性设计,将QDCT应用于红外小目标检测领域,成功地检测到了高检出率、低误警率的红外小目标。 (2)首次对峰度与对比度的关系进行了分析和讨论,然后以峰度作为对比度指标,反映了目标区域与周围背景的差异,从而促进了红外小目标的检测。 (3)运动特征是专为高速红外小目标设计的,在保留运动轨迹的同时,利用运动积累来提取相邻帧之间的相关性。
本文的其余部分组织如下。第二节对QDCT进行了简要介绍。第三节介绍了所提出的方法的详细步骤,包括选择四个特征的原因、四元数的构造、QDCT的过程,以及最终的小目标检测结果。在第四节中,提出了一些关于公共数据集的实验和相关的讨论,以证明所提方法的有效性。在第五节中对本文的总结得出了一个总体的结论。
2、相关工作
QDCT最初是由冯和胡提出的。他们将离散余弦变换(DCT)扩展到四元数场,并提出了一种简单而有效的算法来计算四元数矩阵的凯利-迪克森形式的QDCT。近年来,QDCT已被应用于检测,如人脸检测和火焰检测。这两篇论文都通过将特征提取到QDCT中来实现目标检测。因此,我们努力探索小目标的特征,并将其输入QDCT,然后通过符号函数处理和IQDCT实现显著的小目标检测。详细的QDCT算法过程如下所述。
四元数可以用超复形形式表示为:
I
q
(
m
,
n
)
=
x
1
+
x
2
⋅
i
+
x
3
⋅
j
+
x
4
⋅
k
(
1
)
I_q(m,n)=x_1+x_2·i+x_3·j+x_4·k (1)
Iq(m,n)=x1+x2⋅i+x3⋅j+x4⋅k (1)
其中
x
1
,
x
2
,
x
3
,
x
4
∈
R
,
x
1
,
x
2
,
x
3
x1,x2,x3,x4∈R,x1,x2,x3
x1,x2,x3,x4∈R,x1,x2,x3,
x
4
∈
R
x4∈R
x4∈R满足以下乘法规则:i2=j2=k2=-1,i·j=-j·i=k,j·k=-k·j=i,k·i=-i·k=j。这说明了四元数的乘法是不可交换的。因此,正向QDCT(FQDCT)和逆QDCT(IQDCT)的形式有两种类型,左手形式和右手形式。在本文中,我们将使用左手的
F
Q
D
C
T
L
FQDCT ^L
FQDCTL和
I
Q
D
C
T
L
IQDCT^ L
IQDCTL作为默认的QDCT和IQDCT,分别来表示显著性检测的过程。
F
Q
D
C
T
L
(
u
,
v
)
=
α
u
M
α
v
N
∑
m
=
0
M
−
1
∑
n
=
0
N
−
1
μ
q
I
q
(
m
,
n
)
N
(
u
,
v
,
m
,
n
)
(
2
)
FQDCT^L(u,v)=\alpha _u^M\alpha _v^N\sum_{m=0}^{M-1} \sum_{n=0}^{N-1}\mu _qI_q(m,n)N(u,v,m,n) (2)
FQDCTL(u,v)=αuMαvNm=0∑M−1n=0∑N−1μqIq(m,n)N(u,v,m,n) (2)
其中
I
q
(
m
,
n
)
Iq(m,n)
Iq(m,n)是一个二维的M×N四元数矩阵。µq是一个单位纯虚拟夸脱,满足µq2=−1的约束。
α
u
M
\alpha _u^M
αuM、
α
v
N
\alpha _v^N
αvN和
N
(
u
、
v
、
m
,
n
)
N(u、v、m,n)
N(u、v、m,n)的值参见文献[25]。
因此,
I
Q
D
C
T
L
IQDCT^L
IQDCTL的定义如下:
I
Q
D
C
T
L
(
m
,
n
)
=
∑
u
=
0
M
−
1
∑
v
=
0
N
−
1
α
u
M
α
v
N
μ
q
C
q
(
u
,
v
)
N
(
u
,
v
,
m
,
n
)
(
3
)
IQDCT^L(m,n)=\sum_{u=0}^{M-1} \sum_{v=0}^{N-1}\alpha _u^M\alpha _v^N\mu _qC_q(u,v)N(u,v,m,n) (3)
IQDCTL(m,n)=u=0∑M−1v=0∑N−1αuMαvNμqCq(u,v)N(u,v,m,n) (3)
其中
C
q
(
u
,
v
)
C_q(u,v)
Cq(u,v)是一个二维的M×N四元数矩阵,它表示
I
q
(
m
,
n
)
Iq(m,n)
Iq(m,n)的
F
Q
D
C
T
L
FQDCT^L
FQDCTL的结果。
3、我们的方法
根据红外小目标成像的原理,我们知道小目标的使用特征较少,这也是检测问题的一个难题。我们应该尽可能多地同时利用目标背景和局部背景的特征来进行检测。在一个序列中,目标以高速移动,背景呈现局部方向。这两种特征明显有利于小目标的检测。此外,小目标亮度较大,与周围背景的差异较明显,因此利用对比度特性也是近年来红外小目标检测的主流方向。
图2为所提出的红外小目标检测方法的框架。我们首先通过构造峰度图、两个方向图和运动特征图四种特征图来构建红外图像的四元数。然后,我们用QDCT将变换域中的显著性区域增强为四元数。最后,将逆QDCT(IQDCT)应用于显著性检测结果,恢复目标。
图2 该方法的框架,由输入帧、具体算法和目标检测结果组成。(蓝色矩形表示构建四元数)
A、利用可操纵滤波器构造方向性特征图
可控制滤波器是一种方向可调的卷积核,用于特征提取和图像增强,可以通过一小的旋转版本本身的线性组合来表示。可操纵滤波器可以通过在不同方向生成模板,然后用不同方向的模板对图像进行解卷积,得到图像的边缘。在红外小目标检测中,我们使用可操纵滤波器来提取方向特征,同时也保持小目标的边缘,这是它优于其他方向滤波器的重要原因。方向性特征图
D
θ
(
x
、
y
、
t
)
D_θ (x、y、t)
Dθ(x、y、t)为:
D
θ
(
x
,
y
,
t
)
=
f
(
x
,
y
,
t
)
∗
G
θ
(
x
,
y
,
t
)
(
4
)
D_\theta (x,y,t)=f(x,y,t)*G_\theta(x,y,t) (4)
Dθ(x,y,t)=f(x,y,t)∗Gθ(x,y,t) (4)
其中
G
θ
G_θ
Gθ(x,y,t)为方向角θ∈的可操纵滤波器[0,2π]。f(x,y,t)表示输入图像,其中t为满足t = 1,2,…N的帧指数。N为视频帧数。∗表示卷积算子。
为了平衡计算复杂度和检测性能,我们提取了四个方向的特征图,即
D
0
、
D
45
、
D
90
、
D
135
D_0、D_{45}、D_{90}、D_{135}
D0、D45、D90、D135。相互正交方向的组合对背景抑制有一定的影响(由0o_90o和45o_135o提供),结果如下,其中f1和f2分别代表QDCT的两个通道。
f
1
(
x
,
y
,
t
)
=
D
0
(
x
,
y
,
t
)
⋅
D
90
(
x
,
y
,
t
)
(
5
)
f_1(x,y,t)=D_0(x,y,t)·D_{90}(x,y,t) (5)
f1(x,y,t)=D0(x,y,t)⋅D90(x,y,t) (5)
f
2
(
x
,
y
,
t
)
=
D
45
(
x
,
y
,
t
)
⋅
D
135
(
x
,
y
,
t
)
(
6
)
f_2(x,y,t)=D_{45}(x,y,t)·D_{135}(x,y,t) (6)
f2(x,y,t)=D45(x,y,t)⋅D135(x,y,t) (6)
这里,·表示对应元素的乘法。
为了突出可操纵滤波器的优点,以复杂背景的卷云图像为例,说明使用可操纵滤波器提取方向特征和保留边缘的效果。图3显示了使用可操纵滤波器提取的方向性特征图。为了证明不同方向的组合可以抑制背景,我们在表1中使用了平均值和信噪比(SNR)对其进行了计算。 信噪比反映了目标信号与背景信号的比值。值越大,小目标越突出。平均值反映了图像的整体亮度,该值越小,背景抑制效果越好。通过描述图像的信噪比和平均值,可以看出图3(d)和图3(g)的背景更暗,杂波更少,这使得小目标更加突出。因此,正交方向的组合有利于目标检测。
图3 利用可操纵滤波器得到了方向特征映射和边缘保持结果。(a)原始图像;(b)0o;(c)90o;(d)0o_90o;(e)45o;(f)135o;(g)45o_135o。
表1 比较不同方向特征图和组合后的均值和信噪比
B、峰度特征图
考虑到红外辐射强度变化在小目标之间的边界和背景,小目标可以平稳地分布在一个小范围内,和小目标的局部对比度高,因此,使用对比功能便于小目标的检测。此外,由于目标较小,具有类高斯分布特征,统计峰度反映了样本分布与正态分布之间的差异。因此,在图像处理中,峰度反映了所选图像斑块的分布与小目标的类高斯分布之间的差异。根据峰度的统计原理,利用局部图像补丁在位置(x、y)处的统计峰度来表示(x、y)处的峰度值。具体峰度特征通道可通过以下给出:
k
u
r
(
f
(
x
,
y
,
t
)
)
=
k
−
C
=
E
(
X
−
μ
)
4
σ
4
−
C
=
1
m
n
∑
i
=
1
m
n
(
f
(
x
,
y
,
t
)
−
μ
)
4
σ
4
−
C
(
7
)
\begin{aligned} kur(f(x,y,t))&=k-C=\frac{E(X -\mu )^4}{\sigma^4 }-C\\ &\\ &=\frac{1}{mn} \frac{\sum_{i = 1}^{mn}(f(x,y,t)-\mu ) ^4}{\sigma^4 }-C (7) \\ \end{aligned}
kur(f(x,y,t))=k−C=σ4E(X−μ)4−C=mn1σ4∑i=1mn(f(x,y,t)−μ)4−C (7)
式中,κ为待处理的图像贴片分布的四阶中心距离,m×n为所选图像贴片的大小。f (x、y、t)是t帧图像在(x、y)处的灰度值。µ和σ分别表示图像斑块的灰度均值和标准差。C表示目标分布的峰度值,为特定目标的固定值。例如,正态分布的C是3。在该算法中,我们将红外图像分成大小为5×5的小斑块,并计算斑块中心像素的峰度,而不是每个斑块的局部峰度。
因此,QDCT图像的第三个峰度特征通道由f3给出:
f
3
(
x
,
y
,
t
)
=
k
u
r
(
f
(
x
,
y
,
t
)
)
(
8
)
f_3(x,y,t)=kur(f(x,y,t)) (8)
f3(x,y,t)=kur(f(x,y,t)) (8)
图4为与峰度特征相关的图谱。图4(a)为具有中心位置(x、y)的局部图像块示意图。峰度充分考虑了图像块中的所有样本点。图4(c)为图4(b)的峰度特征图从图4(c)可以看出,目标周围的峰度大于背景周围的峰度。由于图像中的目标是条形的,即使选择图像贴片为5×5,峰度特征图也是矩形分布。也就是说,峰度特征图与目标的形状相似,并且在目标和背景之间有一个清晰的边界。该特性有助于检测目标。
图4 峰度特征图。(a)所选局部图像贴片的示意图;(b)原始红外图像(Seq6的第3帧);(c)峰度特征图。
C、运动特征图
因为在一组红外序列中,目标的运动是快速和连续的,而背景和噪声的变化是随机的。目前,红外序列中的小目标检测方法大多是基于单帧,不考虑运动信息,往往导致整个视频检测中的错误检测。这在实践中是一个致命的问题。为了解决上述问题,运动特征的引入有利于小目标的检测。因此,我们引入一个运动电荷(MC)方法提取运动特征,它不仅可以消除奇点和强烈的背景变化,也减少背景变化对目标检测的影响而突出目标,也可以描述目标的累积效应和反映目标的运动轨迹。假设f (x、y、t)为当前红外序列的t帧,其运动信息可以表示为:
M
o
v
(
x
,
y
,
t
)
=
{
0
i
f
f
(
x
,
y
,
t
)
=
f
(
x
,
y
,
t
−
1
)
1
i
f
f
(
x
,
y
,
t
)
≠
f
(
x
,
y
,
t
−
1
)
(
9
)
Mov(x,y,t)=\left\{ \begin{array}{rcl} 0 & if & { f(x,y,t)=f(x,y,t-1)}\\ 1 & if & {f(x,y,t)\neq f(x,y,t-1) }\\ \end{array} \right. (9)
Mov(x,y,t)={01ififf(x,y,t)=f(x,y,t−1)f(x,y,t)=f(x,y,t−1) (9)
M
o
v
Mov
Mov表示相邻帧之间是否有运动。累积运动特征的定义为:
C
h
M
o
v
(
x
,
y
,
t
)
=
{
C
h
m
i
n
i
f
M
o
v
(
x
,
y
,
t
)
=
1
C
h
i
f
M
o
v
(
x
,
y
,
t
)
=
0
(
10
)
Ch_{Mov}(x,y,t)= \begin{cases} Ch_{min} & if & { Mov(x,y,t)=1}\\ Ch & if & {Mov(x,y,t)=0 }\\ \end{cases} (10)
ChMov(x,y,t)={ChminCh if ifMov(x,y,t)=1Mov(x,y,t)=0 (10)
其中
C
h
=
m
i
n
(
C
h
M
o
v
(
x
,
y
,
t
−
1
)
+
A
,
C
h
m
a
x
)
Ch =min(Ch_{Mov}(x,y,t−1)+ A,Ch_{max})
Ch=min(ChMov(x,y,t−1)+A,Chmax)。当t=为0时,累积运动被初始化为
C
h
M
o
v
(
x
,
y
,
0
)
=
C
h
m
a
x
Ch_{Mov}(x,y,0)= Ch_{max}
ChMov(x,y,0)=Chmax;在本文中,我们将累积结果图像逆作为运动特征,表示为:
m
(
x
,
y
,
t
)
=
255
−
C
h
M
o
v
(
x
,
y
,
t
)
(
11
)
m(x,y,t)=255-Ch_{Mov}(x,y,t) (11)
m(x,y,t)=255−ChMov(x,y,t) (11)
这里A是运动累积的增量参数,设为
A
=
1
A= 1
A=1。
C
h
m
a
x
和
C
h
m
i
n
Ch_{max}和Ch_{min}
Chmax和Chmin分别设置为255和0. 从等式(10)上就可以看到,如果
C
h
M
o
v
=
C
h
m
i
n
Ch_{Mov} = Ch_{min}
ChMov=Chmin,则在
(
x
,
y
,
t
)
(x,y,t)
(x,y,t)检测到运动;如果
C
h
M
o
v
=
C
h
m
a
x
Ch_{Mov} = Ch_{max}
ChMov=Chmax,未检测到运动,最后一次运动的时间未知;如果
C
h
M
o
v
(
x
,
y
,
t
)
=
C
h
m
i
n
+
K
⋅
A
Ch_{Mov}(x,y,t)=Ch_{min}+K·A
ChMov(x,y,t)=Chmin+K⋅A,表示在
(
x
,
y
,
t
)
(x,y,t)
(x,y,t)没有检测到运动,但最后一次运动发生在
t
−
k
⋅
Δ
t
t-k·\Delta t
t−k⋅Δt。这里,
k
=
[
C
h
M
o
v
(
x
,
y
,
t
)
−
C
h
m
i
n
]
/
A
k = [Ch_{Mov}(x,y,t)−Ch_{min}]/A
k=[ChMov(x,y,t)−Chmin]/A运动电荷法的过程如图5所示。
图5 运动电荷(MC)方法的流程图。
在表中。2、评估每个特征分量对Seq1的贡献,以构建最合适的四元数。我们可以看到,运动特征是最重要的特征。因此,我们将运动特征为四元数的实部。最终构造的四元数可以表示为:
q
(
x
,
y
,
t
)
=
m
(
x
,
y
,
t
)
+
f
1
(
x
,
y
,
t
)
i
+
f
2
(
x
,
y
,
t
)
j
+
f
3
(
x
,
y
,
t
)
k
(
12
)
q(x,y,t)=m(x,y,t)+f_1(x,y,t)i+f_2(x,y,t)j+f_3(x,y,t)k (12)
q(x,y,t)=m(x,y,t)+f1(x,y,t)i+f2(x,y,t)j+f3(x,y,t)k (12)
其中,
i
,
j
,
k
满足
i
2
=
j
2
=
k
2
=
−
1
,
i
⊥
j
,
j
⊥
k
,
i
⊥
k
,⊥
i,j,k满足i 2 = j 2 = k 2 =−1,i⊥j,j⊥k,i⊥k,⊥
i,j,k满足i2=j2=k2=−1,i⊥j,j⊥k,i⊥k,⊥是一个垂直符号。
表2 比较不同特征的SCR和BSF
Feature of input to QDCT | SCR | BSF |
---|---|---|
Motion Feature | 3.1577 | 5.2714 |
Kurtosis Feature | 1.9086 | 4.1195 |
Direction Feature | 2.9106 | 4.7532 |
Space domain: Direction+ Kurtosis | 6.4150 | 7.6924 |
Proposed: Motion + Kurtosis + two Directions | 8.9514 | 9.0693 |
为了直观地表示由四个通道构造的四元数的情况,由四个分量所占的四元数的实部或虚部如图6所示。
图6 所构造的四元数的四分量显示。
D.基于QDCT的红外目标检测
我们将QDCT应用于q (x、y、t),得到频率特征图Q (u、v、t)。给定四元数q(x,y,t)的分辨率为M×N,其中M,N分别表示图像的长度和宽度。q(x,y,t)的QDCT由表示为:
Q
D
C
T
(
q
(
x
,
y
,
t
)
)
=
Q
(
u
,
v
,
t
)
=
α
u
M
α
v
N
∑
m
=
0
M
−
1
∑
n
=
0
N
−
1
μ
Q
q
(
x
,
y
,
t
)
N
(
u
,
v
,
m
,
n
)
(
13
)
\begin{aligned} QDCT(q(x,y,t))&=Q(u,v,t)\\ &\\ &=\alpha _u^M\alpha _v^N\sum_{m=0}^{M-1} \sum_{n=0}^{N-1}\mu _Qq(x,y,t)N(u,v,m,n) (13) \\ \end{aligned}
QDCT(q(x,y,t))=Q(u,v,t)=αuMαvNm=0∑M−1n=0∑N−1μQq(x,y,t)N(u,v,m,n) (13)
其中N(u,v,m,n)=
c
o
s
[
π
M
(
m
+
1
2
)
μ
]
c
o
s
[
π
N
(
n
+
1
2
)
v
]
cos[\frac{π}{M}(m+\frac{1}{2})\mu]cos[\frac{π}{N}(n+\frac{1}{2})v]
cos[Mπ(m+21)μ]cos[Nπ(n+21)v]和
α
u
M
\alpha _u^M
αuM和
α
v
N
\alpha _v^N
αvN是QDCT的系数,可以取为[25]。
μ
Q
\mu_Q
μQ为单位纯虚夸特,表示如下。
μ
Q
=
−
1
3
i
−
1
3
j
−
1
3
k
(
14
)
\mu _Q=-\sqrt{\frac{1}{3} }i-\sqrt{\frac{1}{3} }j-\sqrt{\frac{1}{3} }k (14)
μQ=−31i−31j−31k (14)
只要QDCT获得,我们使用符号函数提取变换区域的显著区域自四元数的符号函数对应于视觉反应,视觉系统如何感知突出的对象在图像,它可以删除背景杂乱。四元数
Q
=
Q
(
u
、
v
、
t
)
Q = Q(u、v、t)
Q=Q(u、v、t)的符号函数
s
g
n
(
Q
)
sgn (Q)
sgn(Q)定义为:
Q
′
=
s
g
n
(
Q
)
=
{
x
0
∣
Q
∣
+
x
1
∣
Q
∣
i
+
x
2
∣
Q
∣
j
+
x
3
∣
Q
∣
k
,
∣
Q
∣
≠
0
0
,
|Q| =0
(
15
)
Q^\prime =sgn(Q)= \begin{cases} \frac{x_0}{|Q|}+\frac{x_1}{|Q|}i+\frac{x_2}{|Q|}j+\frac{x_3}{|Q|}k, & {|Q| \neq 0}\\ 0,& \text{|Q| =0} \end{cases} (15)
Q′=sgn(Q)={∣Q∣x0+∣Q∣x1i+∣Q∣x2j+∣Q∣x3k,0,∣Q∣=0|Q| =0 (15)
其中,
x
0
、
x
1
、
x
2
、
x
3
x0、x1、x2、x3
x0、x1、x2、x3分别是Q的四个分量。
∣
Q
∣
是四元数的大小,
∣
Q
∣
=
Q
⋅
Q
‾
。
Q
‾
是
Q
|Q|是四元数的大小,|Q| = \sqrt {Q·\overline Q}。\overline Q是Q
∣Q∣是四元数的大小,∣Q∣=Q⋅Q。Q是Q的复共轭。
最后,应用
I
Q
D
C
T
将
Q
′
IQDCT将Q^\prime
IQDCT将Q′转换回空间域。为了得到更平滑的结果,我们使用(17)得到最终重建的目标检测结果。
q
′
(
x
,
y
,
t
)
=
I
Q
D
C
T
(
s
g
n
(
Q
D
C
T
(
q
(
x
,
y
,
t
)
)
)
)
=
I
Q
D
C
T
(
Q
′
)
=
∑
u
=
0
M
−
1
∑
v
=
0
N
−
1
α
u
M
α
v
N
μ
q
Q
′
(
u
,
v
,
t
)
N
(
u
,
v
,
m
,
n
)
(
16
)
\begin{aligned} q^\prime(x,y,t)&=IQDCT(sgn(QDCT(q(x,y,t))))=IQDCT(Q^\prime)\\ &\\ &=\sum_{u=0}^{M-1} \sum_{v=0}^{N-1}\alpha _u^M\alpha _v^N\mu _qQ^\prime(u,v,t)N(u,v,m,n) (16) \\ \end{aligned}
q′(x,y,t)=IQDCT(sgn(QDCT(q(x,y,t))))=IQDCT(Q′)=u=0∑M−1v=0∑N−1αuMαvNμqQ′(u,v,t)N(u,v,m,n) (16)
S
(
x
,
y
,
t
)
=
g
(
x
,
y
)
∗
[
q
′
(
x
,
y
,
t
)
⊙
q
′
‾
(
x
,
y
,
t
)
]
(
17
)
S(x,y,t)=g(x,y)*[q^\prime(x,y,t)\odot\overline{q^\prime}(x,y,t) ] (17)
S(x,y,t)=g(x,y)∗[q′(x,y,t)⊙q′(x,y,t)] (17)
其中
g
(
x
,
y
)
g(x,y)
g(x,y)是一个使用
σ
=
1.5
σ = 1.5
σ=1.5的高斯平滑滤波器。
⊙
\odot
⊙表示元素级乘积。
最终的目标结果及
Q
′
Q^\prime
Q′对应的四个分量如图7所示。图7(b)至图7(e)为
Q
′
Q^\prime
Q′的四个组成部分特征图。由于单个特征图较弱,因此有必要将四个特征图融合在一起,以提高检测结果,如图7(f)所示。
图7 四个通道的QDCT结果和最终的目标检测结果。(a)原始图像(Seq6的第35帧);(b)
0
o
0^o
0o _
9
0
o
90^o
90o;( c )
4
5
o
45^o
45o_
13
5
o
135^o
135o;(d)峰度特征图;(e)运动特征图;(f)检测结果。
4、实验和结果
在本节中,通过与8种最先进的方法进行比较,证明了该方法的性能和鲁棒性。所有实验都由Matlab 2016b在具有2.50 GHz Intel i5 CPU的PC上实现。数据集和代码演示可以在Github(https://github.com/wxw211311/small-target)上找到。
A.评价指标
我们选择信号杂波比(
S
C
R
SCR
SCR)和背景抑制因子(
B
S
F
BSF
BSF)作为评价指标。
S
C
R
G
a
i
n
和
B
S
F
SCR_{Gain}和BSF
SCRGain和BSF的定义为:
S
C
R
G
a
i
n
=
(
S
/
C
)
o
u
t
(
S
/
C
)
i
n
(
18
)
SCR_{Gain}=\frac{(S/C)~out~}{(S/C)~in~} (18)
SCRGain=(S/C) in (S/C) out (18)
B
S
F
=
C
o
u
t
C
i
n
(
19
)
BSF=\frac{C~out~}{C~in~} (19)
BSF=C in C out (19)
其中,S和C分别为平均目标强度和杂波标准差。
(
⋅
)
i
n
(·)_{in}
(⋅)in中表示原始图像,
(
⋅
)
o
u
t
(·)_{out}
(⋅)out为检测结果。另外,
C
i
n
和
C
o
u
t
C_{in}和C_{out}
Cin和Cout分别是原始红外图像和检测结果图中的背景标准差。SCR指数测量了目标在处理前后相对于背景的放大率。BSF表示没有任何目标信息的背景的抑制效果。
受试者工作特征(ROC)曲线定量地描述了假阳性率(FPR)与真阳性检出率(TPR)之间的变化关系,其定义如下:
F
P
R
=
n
u
m
b
e
r
o
f
d
e
t
e
c
t
e
d
f
a
l
s
e
t
a
r
g
e
t
s
t
o
t
a
l
n
u
m
b
e
r
o
f
p
i
x
e
l
s
i
n
t
h
e
w
h
o
l
e
i
m
a
g
e
(
20
)
FPR=\frac{number of detected false targets}{total number of pixels in the whole image} (20)
FPR=total number of pixels in the whole imagenumber of detected false targets (20)
T
P
R
=
n
u
m
b
e
r
o
f
d
e
t
e
c
t
e
d
t
r
u
e
t
a
r
g
e
t
s
t
o
t
a
l
n
u
m
b
e
r
o
f
r
e
a
l
t
a
r
g
e
t
s
(
21
)
TPR=\frac{number of detected true targets}{total number of real targets} (21)
TPR=total number of real targetsnumber of detected true targets (21)
B.在天空背景下的结果和分析
复杂背景下红外小目标的检测可以作为一个显著性检测问题,需要抑制复杂背景,同时增强目标,然后将移动目标和突出目标与背景分离,以实现检测的目的。此外,三维曲面图还可以反映目标的位置。因此,为了验证所提方法的有效性,图8显示了使用该方法处理前后的三维表面图。将图8( b )与图8( c )进行比较,我们可以看到原始图像的背景非常复杂,目标几乎淹没在图8( b )中的严重杂波中。在图8( c )中,背景明显被抑制,小目标更突出,有利于准确定位目标。这也证明了该方法对复杂背景下的小目标检测是有效的。
图8 治疗前后三维网格的比较。( a )原始图像(Seq6的第39帧);( b )原始图像的三维网格;( c )检测结果的三维网格。
表3 测试数据集的详细信息
Sequences | Number | Size | Target Details | Background Details |
---|---|---|---|---|
Seq1 | 70 | 256X200 | An aircraft with slender shape. Moving fast in the sequence. | Changing sky backgrounds with light noise. |
Seq2 | 100 | 320X240 | Extremely small moving target. | Background with huge and complex clutter. |
Seq3 | 32 | 320X240 | Weak target with irregular movement. | Blurred backgrounds with extremely low signal to clutter ratio. |
Seq4 | 52 | 128X128 | Extremely tiny moving target. | Sky scene with banded cloud. |
Seq5 | 32 | 320X240 | An aircraft with changing intensity. | Changing backgrounds with heavy cloud clutter. |
Seq6 | 40 | 256X200 | An aircraft with slender shape. Moving fast in the sequence | Backgrounds with fixed clutter. |
表4 八种测试方法的详细参数设置
为了公平地评价红外检测方法的性能,我们使用了由6个不同复杂背景的公共红外序列组成的数据集,详细的特征列于表3中。这些数据库在大多数相关的论文中都有使用。这些序列具有较长的成像距离,从而导致小目标,并且它们都是具有低信噪比的云背景或天空背景。总体上,该数据集包含了机载红外目标探测中的各种情况。因此,利用给定的数据库可以相当好地显示红外检测方法的性能。
比较9个方法是自适应巴特沃斯高通滤波器(A-BHPF),LCM,NVMD,导数熵对比度(DECM),稳定多子空间学习(SMSL),频率调谐(FT),谱残留(SR),PQFT和提出的方法。前五种方法在空间域,后四种方法在频域。实验中使用的详细参数设置(见表4)可用于代码复现。这些方法的实验结果如表5所示。每一列中每个评价指标的最高值标记为红色,第二高的值标记为蓝色。
从表5中显示可以看出,该方法在Seq1、Seq2、Seq4和Seq6测试中达到了最高的 S C R G a i n 和 B S F SCR_{Gain}和BSF SCRGain和BSF值。该方法可以在一定程度上提高 S C R G a i n SCR_{Gain} SCRGain,并增强了背景边缘。这意味着检测到的小目标比背景更突出,同时对背景有较好的抑制效果。也就是说,对于这些测试序列,从数值指示值的角度来看,本文方法在目标增强和背景抑制方面都优于对比方法。对于Seq3和Seq5的测试,所提出的方法BSF最高, S C R G a i n SCR_{Gain} SCRGain第二高,仅略低于NVMD或SR方法。虽然NVMD方法在测试Seq3中具有最高的 S C R G a i n SCR_{Gain} SCRGain,但其 B S F BSF BSF明显低于我们的方法,这使得检测结果仍然有噪声。对于Seq5,该方法的 S C R G a i n SCR_{Gain} SCRGain略弱于SR,主要是因为其云量较厚、较重,甚至有遮挡。一般来说,本文提出的方法可以获得最佳的检测效果,在后续的讨论中也是如此。特别是,背景抑制的效果最为显著。
表5 S C R G a i n SCR_{Gain} SCRGain、 B S F BSF BSF的评价指标比较
Methods | Evaluation indices | Seq1 | Seq2 | Seq3 | Seq4 | Seq5 | Seq6 |
---|---|---|---|---|---|---|---|
A-BHPF | SCRGain BS F | 5.4441 5.7940 | 6.3202 6.3302 | 4.3424 10.0769 | 8.2873 5.7776 | 3.1847 5.4137 | 4.9993 6.6330 |
LCM | SCRGain BS F | 6.8327 8.3709 | 7.9143 6.5534 | 6.4393 4.5440 | 3.1285 3.4407 | 7.5129 5.6598 | 12.0083 8.2904 |
NVMD | SCRGain BS F | 8.7927 1.9432 | 11.9417 5.3073 | 28.8934 8.9912 | 14.0527 9.9832 | 4.8195 5.6990 | 11.2148 4.8252 |
DECM | SCRGain BS F | 2.4107 8.9276 | 3.6982 6.0803 | 11.1416 12.7720 | 4.1627 9.0029 | 5.5311 8.5631 | 1.9486 7.9391 |
SMSL | SCRGain BS F | 7.6500 6.6333 | 12.7613 5.2354 | 17.7629 8.0814 | 13.9977 9.3976 | 6.1374 5.4073 | 9.7163 8.4853 |
FT | SCRGain BS F | 0.9417 1.1701 | 2.6620 1.2675 | 1.3629 1.4807 | 2.1013 2.8051 | 3.6705 1.4275 | 1.7811 0.9381 |
SR | SCRGain BS F | 7.8808 2.4324 | 9.3162 4.5654 | 20.2515 9.6430 | 7.4176 5.9103 | 8.3057 5.1150 | 11.1710 7.1150 |
PQFT | SCRGain BS F | 6.2069 6.6411 | 7.7745 5.3644 | 12.8211 11.0308 | 9.7753 7.1316 | 5.2869 6.0371 | 9.6814 8.6902 |
Proposed | SCRGain BS F | 8.9514 9.0693 | 14.5348 7.0875 | 27.3039 13.6718 | 14.4161 10.5222 | 7.5972 10.7471 | 15.4176 9.4569 |
为了更直观地呈现处理结果,并直观地显示目标/背景增强能力,图9给出了原始图像和检测结果的三维(3D)网格和检测结果。显然,几乎所有的背景的组成部分都被抑制住了。从原始红外图像中可以看出,始终存在着灰度接近或高于目标的背景区域。这导致了从红外序列中检测小目标的困难。相比之下,该方法的检测结果在三维网格中具有相对平滑的背景。从我们的方法的检测结果中更容易确定小目标的位置和大小,误报更少。在图9(d)中,该方法对不同场景和近似服从突出显示的变量二维高斯模型的目标像素表现出良好的鲁棒性和有效性。
请注意,在图10中,红色圆圈表示检测到的真实目标,绿色圆圈表示一些类似目标的误报。第一列表示原始的序列帧。分别选择Seq1到Seq6的#1帧、#15帧、#35帧、#19帧、#35帧和#30帧来显示对比结果。从图10的实验结果来看,该方法在目标增强和背景抑制方面具有良好的性能。实验结果说明了每种方法的特点。从图10(g)可以看出,FT方法对复杂背景的抑制效果较差,特别是在Seq1中,仍然存在一些背景的地面杂波。利用频率差法将高频杂波划分为小目标。此外,A-BHPF和PQFT也能在一定程度上抑制小目标的强度,也就是削弱目标。从主观视觉来看,SR方法在一般情况下可以增强目标,但其背景抑制效果较差。例如,仍然有太多的云干扰和错误的目标。从图10(d)可以看出,LCM在三种情况下具有良好的目标增强能力。然而,由于红外目标检测结果在很大程度上依赖于LCM方法中的适当阈值,本文选择的自适应阈值不能很好地检测Seq1、Seq3和Seq4中的目标。特别是在带有带状云的Seq4中,阻塞效果太明显,检测效果不好。从图10(e)可以看出,NVMD方法在一般情况下对从复杂背景中提取小目标具有较好的性能。然而,当原始序列有很多噪声时,在Seq1和Seq6中仍然存在很多噪声。对于SMSL,当目标太暗,很难清晰地区分目标和背景时,学习机制会将目标分配到背景的一个子空间,导致目标消失。从图10(g)可以看出,由于使用了滑动窗口修补技术,SMSL的砌块效应比较明显。虽然目标得到了增强,但背景没有得到很好的抑制,仍然存在一些杂波和明显的块缺陷,使其BSF更低。从图10(j)可以看出,利用复杂背景,从复杂背景中准确提取模糊的小目标,利用QDCT来抑制背景,增强目标。这表明,该方法在增强目标和抑制背景方面具有良好的性能。
图9 (a)原始图像;原始图像的(b)三维网格;©检测结果;(d)检测结果的三维网格。
图10。在Seq1 ~ Seq6上采用不同方法处理的主观视觉对比度、原始图像和小目标检测结果。(b) ~ (j)分别表示使用A-BHPF、SR、LCM、NVMD、DECM、SMSL、FT、PQFT和所建议的方法的对应检测结果。
图11 7种检测方法对6种测试图像序列的耗时时间比较。
我们也对所有方法的处理时间进行了比较。9种方法的平均时间消耗比较见图11。具有相同颜色的条形图表示用特定方法处理图像所需的平均时间。虽然LCM方法具有较高的检测精度(在Seq1、Seq2和Seq6上仍低于所提出的方法),但在时间上太昂贵。这些测试序列的平均每帧运行时间超过15秒,甚至高达50秒,这显然不适合视频序列的红外小目标检测。我们还可以看到,本文所提出的方法比FT和A-BHPF方法稍慢,比其他方法更快。总之,该方法比FT和A-BHPF方法更好,其检测效果弥补了细微的缺陷。
图12 不同方法的ROC曲线。(a)到(f)对应于测试序列Seq1到Seq6的结果。一条曲线越靠近左上角,对应的方法就越好。
为了进一步证明所开发的方法的优点,我们提供了表5中所使用的测试序列的受试者工作特征(ROC)曲线。其纵轴为序列的假阳性率,其横轴为序列的真阳性率。ROC曲线如图12所示。由于简单的频率差不能处理复杂的背景,因此FT几乎总是表现最差的。SMSL的性能波动很大。对于Seq3,SMSL工作较差,但在其他序列中取得了成功,这主要是因为检测错误。LCM和DECM也得到了类似的结果,但这些结果并不稳定。这表明它们在复杂的背景下具有较低的鲁棒性。最大的差异是Seq3,表明该方案略低于NVMD,可能是由于弱目标被阻断时可能被错误检测到。但该方法的背景抑制效果优于NVMD。总的来说,相对于相同的FPR,所提出的方法几乎总是达到最高的TPR,这意味着所提出的方法优于其他最先进的方法。此外,AUC值也列在表6中。AUC是由ROC曲线所包围的区域,它也可以直接反映检测性能。
图13 在L15NSS、L1415S、L19NSS上采用不同方法处理的主观视觉对比度、原始图像和小目标检测结果。(b)~(j)分别表示使用A-BHPF、LCM、NVMD、DECM、SMSL、FT、SR、PQFT和所提方法的对应检测结果。
表6 9种方法的曲线下面积(AUC)值
Methods | Seq1 | Seq2 | Seq3 | Seq4 | Seq5 | Seq6 |
---|---|---|---|---|---|---|
A-BHPF | 0.9969 | 0.9943 | 0.9961 | 0.9978 | 0.9958 | 0.9976 |
LCM | 0.9976 | 0.9952 | 0.9957 | 0.9971 | 0.9976 | 0.9984 |
NVMD | 0.9973 | 0.9976 | 0.9984 | 0.9983 | 0.9979 | 0.9983 |
DECM | 0.9974 | 0.9955 | 0.9968 | 0.9979 | 0.9973 | 0.9973 |
SMSL | 0.9972 | 0.9981 | 0.9978 | 0.9982 | 0.9974 | 0.9974 |
FT | 0.9935 | 0.9949 | 0.9959 | 0.9953 | 0.9961 | 0.9961 |
SR | 0.9967 | 0.9980 | 0.9969 | 0.9974 | 0.9973 | 0.9976 |
PQFT | 0.9970 | 0.9972 | 0.9978 | 0.9977 | 0.9976 | 0.9980 |
Proposed | 0.9982 | 0.9984 | 0.9980 | 0.9983 | 0.9979 | 0.9986 |
C. 土地背景下的研究结果与分析
为了进一步证明该算法的性能,本节比较了陆地背景下的三个小红外目标序列。八个比较的方法及其参数的设置与上一节中的天空背景相同。数据集可在Github中下载,由哈尔滨工业大学提供,详细特征见表7。这些序列的成像距离长,导致红外目标小,信噪比低。因此,利用给定的数据库来证明红外检测方法的性能是合适的。
通过比较9种方法的结果进行主观分析,如图13所示。三行表示三个土地背景序列的检测结果(选择有代表性帧)。每一列表示一种检测方法,从第二列到第十列表示使用A-BHPF、LCM、NVMD、DECM、SMSL、FT、SR、PQFT和所提出的方法得到的结果。从图13可以看出,LCM方法产生了明显的块效应,检测到的目标区域与所选的图像补丁大小相同。A-BHPF、NVMD、DECM、SMSL可以检测目标,但仍有一些杂波,背景滤波不干净。PQFT方法虽然有较好的背景抑制效果,但噪声点较多。该方法可能存在目标增强不明显的问题,背景抑制的效果明显最好。另外,其他8种对比度方法几乎都是基于单帧检测,因为它们不选择运动特征,因此也可能产生错误检测和检测到小的错误目标。
表7 测试数据集的详细信息
Sequences | Number | Size | Target Details | Background Details |
---|---|---|---|---|
L15NSS | 100 | 128x128 | Small and dim dot infrared target. Moving fast in the sequence. | Changing land backgrounds with a lot of clutter. |
L14I5S | 100 | 128x128 | Extremely small moving target because of the far imaging distance. | Backgrounds with huge and complex clutter. |
L19NSS | 100 | 128x128 | Weak target with regular movement. | Blurred backgrounds with extremely low signal to clutter ratio. |
表8 SCRGain、BSF和时间(s)的评价指标比较
Sequences | Evaluation indices | A-BHPF | LCM | NVMD | DECM | SMSL | FT | SR | PQFT | Proposed |
---|---|---|---|---|---|---|---|---|---|---|
L15NSS | SCRGain BS F Time | 3.4196 3.8154 0.0680 | 2.9143 1.7836 6.3255 | 5.4634 3.9824 0.9486 | 0.8615 5.3300 2.9457 | 3.4169 3.2025 0.2211 | 1.9860 1.3740 0.0308 | 2.7621 4.2747 0.2398 | 5.5525 4.6934 0.1014 | 6.1826 5.4716 0.1265 |
L1415S | SCRGain BS F Time | 4.9587 4.7538 0.0703 | 4.2027 2.7215 6.1719 | 6.1791 5.5189 0.8975 | 3.5991 5.1600 3.3356 | 5.4654 4.7538 0.1276 | 1.5989 1.5337 0.0255 | 3.9094 3.5266 0.2378 | 5.9529 5.5239 0.0741 | 6.3144 5.6277 0.1005 |
L19NSS | SCRGain BS F Time | 1.8996 2.2943 0.0723 | 2.8330 1.4513 4.9555 | 2.9461 3.6271 0.9044 | 1.3186 3.3177 3.1127 | 3.8330 2.5708 0.2148 | 1.0810 1.5576 0.0202 | 2.7293 3.1367 0.2393 | 2.9684 3.2888 0.1025 | 3.3472 4.2532 0.0885 |
表9 9种方法对土地背景的AUC值
Sequences | A-BHPF | LCM | NVMD | DECM | SMSL | FT | SR | PQFT | Proposed |
---|---|---|---|---|---|---|---|---|---|
L15NSS | 0.7460 | 0.9108 | 0.9177 | 0.5120 | 0.7696 | 0.7143 | 0.7108 | 0.8875 | 0.9308 |
L1415S | 0.9331 | 0.9918 | 0.9216 | 0.6020 | 0.9076 | 0.6884 | 0.8508 | 0.9467 | 0.9995 |
L19NSS | 0.8532 | 0.8308 | 0.9636 | 0.5810 | 0.9732 | 0.7943 | 0.9240 | 0.9344 | 0.9825 |
为了进一步比较不同方法的检测性能,我们仍然使用表8中的 S C R G a i n 和 B S F SCR_{Gain}和BSF SCRGain和BSF进行定量和客观比较。可以看出,除序列L19NSS略低于SMSL外,该方法在两个指标上均达到最高值。对于这个序列,红外目标是较大的,而不是一个完全意义上的小目标。此外,虽然SMSL方法的背景抑制不明显,但保留了小目标的轮廓,更接近目标的地面真实值,从而使其具有更大的 S C R G a i n SCR_{Gain} SCRGain增益。
与在天空背景下的实验分析相似,在图14中给出了9种方法对3种真实红外小目标序列的ROC曲线。从图14可以看出,本文方法检测结果最好。当误报率相同时,该算法的检测精度最高,曲线下面积最大。此外,AUC值也列在表9中。
图14 9种方法对3种真实陆地背景红外图像序列的ROC曲线。( a ) L15NSS,( b ) L1415S,( c ) L19NSS
5、结论
针对复杂背景下的目标检测问题,提出了一种基于QDCT的实现红外小目标检测的新方法。在该方法中,我们提出了一种构造四元数的新方法,它考虑了两个方向特征、一个运动特征和一个峰度特征。QDCT中的符号函数作为一个显著性签名,有助于解决小目标检测问题。为了证明该方法在复杂场景中的性能,我们通过与在相关数据集上应用最广泛的目标检测算法进行比较,评估了所提出的方法。实验结果表明,该方法能够在复杂背景下提取小目标,且在SCRGain、BSF和ROC曲线上均优于该方法。总之,实验验证了该方法的有效性和有效性。我们能够在高度复杂的背景下获得更高的结果。目前,我们正尝试利用GPU来加速所提出的方法,希望在红外和可见光图像融合、显著性检测等实际应用中得到更广泛的应用。