Facet Kernel详解、Random Walk随机游走算法详解

FightingCSH

已于 2022-05-05 21:46:37 修改

阅读量4.4k

点赞数 4

文章标签：算法

于 2022-04-27 16:31:38 首次发布

本文链接：https://blog.csdn.net/FightingCSH/article/details/124427360

版权

本文解析了红外小目标检测中的FacetKernel算法，基于傅立叶变换显著性检测的改进，并介绍了如何通过FacetKernel提取目标区域，以及Random Walker随机游走算法在区分目标与背景中的作用。讨论了如何利用离散正交多项式简化计算，以及随机游走在图像分割中的原理和应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

之前在处理项目相关的红外小目标检测时，阅读到一片19年TGRS的文章：

Infrared Small Target Detection Based on Facet Kernel and Random Walker

其发表的FKRW算法流程为：

（1）预处理：统计滤波+均值滤波

（2）Facet Kernel + 阈值分割前背景：使用Facet Kernel 提取可能目标区域，在使用阈值分割

关键在于Facet kernel怎么来的，为什么如此涉及

（3）Random walker随机游走算法：使用RM算法，以类似ROI的思想与连通域的思想，对结果图进行分析，确定目标与背景杂音之间区别，并由此进行区分

（4）NLCD因子计算（目前先略，后续补充）

**************************************************************************************************************

首先，本文的PFT-saliency显著性方法是基于傅里叶变换的视觉显著性检测。

对视觉显著性建模的研究表明，自然图像的傅里叶变换相位谱（PFT）丰富地包含了引起人类注意的显著信号的位置信息

那么基于PFT的显著性如何度量？给出公式如下：

$p=P[F(I))]$

$R=F^\textup{-1}(e^{i*p})$

$S=G*||R||^{2}$

其中 $F$ & $F^{-1 }$ 分别代表Fouier与inverse Fouier变换， $P$ 代表相位谱计算， $G$ 代表高斯滤波， $S$ 代表最终的显著性图。

但研究显示，PFT-saliency会带来不希望出现的杂波，同时干扰红外小目标检测效果，造成检测失败的结果。

故，文章提出了一个新的快速显著性的方法

**************************************************************************************************************

Facet Kernel的来源以及其设计思路

Facet Kernel起源于Facet 模型

Facet模型包含一个假设：假设某像素的灰度强度曲面可用一个二元三次多项式近似。但使用最小二乘来逼近这个强度曲面，则会过于computationally intense。所以如果该强度曲面可以由一堆离散正交多项式线性组合而成，则计算起来会方便许多。总而言之，使用DOP（离散正交多项式）的线性组合就是为了简化计算，提升计算效率。

至于离散正交多项式的正交基与基前系数怎么求，具体的数学推导不便在文章中呈现。但这里给出思路：

（1）确定二维对称邻域大小R*C

（2）由于基底完全由二维对称邻域大小确定，且其中的系数完全由邻域坐标决定，所以近凭R*C邻域坐标即可确定出该邻域对应的基的具体情况。
（3）鉴于第二步已经精确求出R*C邻域的基底，则接下来需要确定用于拟合的离散正交基的基前系数K。由于要使用最小二乘法逼近原始图像的灰度曲面（ $\varepsilon =[I(r,c)-f(r,c)]\textup{2}$ ），通过数学推导后，可以直观发现，基前系数

$K_{i}=\frac{\sum_{(r,c)\epsilon (R,C)}^{}P_{i}(r,c)*I(r,c)}{\sum_{(r,c)\epsilon (R,C)}^{}P_{i}^{2}(r,c))}$

即

$K_{i} \ \ \ \ \ \alpha\ \ \ \sum_{(r,c)\epsilon (R,C)}^{} \omega _{i}*I(r,c)$

也就是说，基前系数 $K_{i}$ 可由以 $\omega _{i}$ 为矩阵内量的矩阵与 $(R,C)$ 邻域的 $I(r,c)$ 卷积表示。

简言之，只要知道 $(R,C )$ 邻域大小与对应的图像灰度，便可以拟合出该邻域内的灰度曲面

以上便是Facet 模型的思想

接下来开始讲解基于Facet model的Facet kernel的由来：因为我们要突出小目标的位置，并将其与背景分开来，便可以与显著性思想联系起来。但由于频谱残差方法与PFT方法在小目标检测时，基本等效于高斯平滑与梯度计算。所以我们便可以通过求解图像patch的梯度来获得显著性图像，亦即，突出小目标。

既然要求梯度，就必然要获得图像的灰度分布曲面函数，但求解通过直接拟合函数逼近真实分布过于耗时，无法达到实时性的要求，于是便选用Facet model，通过一群离散切比雪夫多项式来逼近真实分布函数（思想类似于傅里叶变换逼近）。

通过上文中对Facet model的讲解，仅需要得知n*n大小的坐标与其中每个坐标对应的真实像素值，即可求解逼近二元三次灰度分布曲面的Facet model。

有了图像patch的分布函数：

$f(x,y)=\sum_{i=0}^{10}K_{i}(x,y)*P_{i}(x,y)$

(二元三次曲面的基只有10个)

由于我们不需要获取patch中每个像素的梯度（卷积核后滑会重复计算），所以只计算patch的中心像素梯度即可。对 $f(x,y)$ 求二阶偏导，便可获得patch中心像素梯度：

$g(0,0) = (2K_{4},2K_{6})$

那么 $K_{4}K_{6}$ 如何获得

上面对Facet model的讲解中说到了，所有的基前系数均可用权重矩阵与patch卷积获得：

$K_{i} \ \ \ \ \ \alpha\ \ \ \sum_{(r,c)\epsilon (R,C)}^{} \omega _{i}*I(r,c)$

而权重矩阵又仅由patch坐标得来。所以 $W_{4} \ \ \ W_{6}$ 求解如下:

$W_{4}=\frac{1}{70}\begin{bmatrix} 2& 2 &2 &2 &2 \\ -1& -1 &-1 & -1 & -1\\ -2& -2 & -2 & -2 & -2\\ -1& -1 & -1 & -1 & -1\\ 2&2 &2 & 2 &2 \end{bmatrix}$ $W_{6}=W_{4}^T$

其中 $P_{4}=x^{2}-2\ \ \ \ \ \ \ P_{6}=y^{2}-2$

求梯度要进行两次卷积，但 $W_{4}\ W_{6}$ 结构相同，只是转置，所以用 $(W_{4}+W_{4}^{T})$ 去与patch卷积就好了。

那么 $(W_{4}+W_{4}^{T})$ 便是我们的Facet Kernel：

$Facet\ Kernel = \begin{bmatrix} -4 & -1 & 0 & -1 & -4\\ -1& 2 & 3 & 2 & -1\\ 0& 3 & 4 & 3& 0\\ -1& 2& 3 & 2 & -1\\ -4& -1 & 0 & -1 & -4 \end{bmatrix}$

简言之，使用Facet Kernel对图像卷积，便可得到图像梯度图，亦即，显著性图像。

**************************************************************************************************************

Random walker随机游走算法

由2006年的一片PAMI讲起：

Random walks for image segmentation. IEEE Transactions on Pattern Analysis & Machine Intelligence, 28, 1768-1783.

RW算法核心理念就是：任何随机行走者所携带的守恒量都各自遵循一个扩散规律。

从一个或一系列顶点开始遍历一张图。在任意一个顶点，遍历者将以概率1-a游走到这个顶点的邻居顶点，以概率a随机跳跃到图中的任何一个顶点，称a为跳转发生概率，每次游走后得出一个概率分布，该概率分布刻画了图中每一个顶点被访问到的概率。用这个概率分布作为下一次游走的输入并反复迭代这一过程。当满足一定前提条件时，这个概率分布会趋于收敛。收敛后，即可以得到一个平稳的概率分布。

首先，用一个一维情况先来解释RW算法：初始条件：一维空间中，从左到右依次有点0~点W。从任意一个点（非点0与点W）出发，向左向右移动的概率均为1/2，到达边界之后停止移动。用 $P_n$ 代表初始位置为n最终到达边界点0的概率。 $P_0=1$ ； $P_w=0$ 。由全概率公式有：

$P_n =\frac{1}{2}P_{n-1} + \frac{1}{2}P_{n+1}$

整理一下：

$P_{n+1}=2P_{n}-P_{n-1}$

左右同减 $P_{n}$ :

$P_{n}-P_{n-1} = P_{n-1}-P_{n-2}$ ......= $P_{1}-P_{0}=k$

迭代相加得：

$P_{n} =kn+P_{0}$ (解得 $k=-\frac{1}{w}$ ) $P_{n}$

最终解得：

$P_{n}=1-\frac{1}{w}$

概率 $P_{n}$ 趋于稳定。

二维情况，虽更复杂，但思维方式上与一维完全相同，最终到达固定seed的概率也会趋于稳定

其次，RW算法是一个基于图网的应用于图像分割的高效算法。既然基于图网，必须要给出图的精准定义：

（1）图结点： $V$

（2）连接节点的边： $e\subseteq E$ , $e_{ij}$ 代表该边连接结点 $v_{i}$ 与 $v_{j}$

（3）边的权重： $w_{ij}$ = $w(e_{ij })$

（4）结点的度： $d_{i}=\sum w_{ij }$ ,代表第i个结点的度=所有连接结点 $v_{i}$ 的边权重之和

（5）度矩阵： $D(V)$ .度矩阵代表每个结点的度，度表示每个顶点连接边的数量（权重之和）

(6) 邻接矩阵： $A(v )$ 邻接矩阵。代表点与点之间的连接情况

(7) 拉普拉斯矩阵： $L(V)$ $=D-A$ 或引入权重后的

本文中拉普拉斯矩阵的定义如下：

边权重与图像结构的映射

由于RW算法是一个基于图网的算法，而我们处理的却是基于图像的问题。如何将图像与图网建立映射？答案便是使用图的边权重 $w_{ij}$ 来代表图像结构，这也是使用图网来分析图像的常见方式。

在给定图网的精准定义后，第一件事就是如何确定边权重？

RW算法采用传统的高斯权重函数来度量边权重，公式如下：

$w_{ij} = e^{-\beta (g_{i}-g_{j})^2}$

其中， $g_{i}$ 与 $g_{j}$ 分别代表图像 $Pixel_{i}$ 与 $Pixel_{j}$ 的像素强度，而 $\beta$ 则是整个算法中唯一的可变系数。

且在定义权重 $w_{ij}$ 前，将像素梯度 $(g_{i}-g_{j})^2$ 归一化一下，会很有用很方便后续处理。

如何解决上述“有限时间无法计算”的问题

上文说到，随机游走算法判断某一 $Pixel$ 属于哪一类时的方法是，判定该 $Pixel$ 第一次到达某个种子节点时的概率。而由文献[1][2][3]文章作者由注意到，组合Dirichlet问题的解与期望的random walk概率相等。

[1] P. Doyle and L. Snell, Random Walks and Electric Networks, no. 22, Washington, D.C.: Math. Assoc. of Am., 1984

[2] S. Kakutani, “Markov Processes and the Dirichlet Problem,” Proc. Japanese Academy, vol. 21, pp. 227-233, 1945

[3] Grady, L. . (2006). Random walks for image segmentation. IEEE Transactions on Pattern Analysis & Machine Intelligence, 28, 1768-1783

最终解得,其中X为未标记点被分类为某一类的概率， $B$ 与 $L_{u}$ 如下所示。

但作者用另一种方式给出了解：既然概率趋于稳定，在初始阶段，整个系统的能量必定是最高的，最终趋于稳定最小。最小化能量函数： $E(P_c)=P_c^TLP_c$

如上所解，RW算法便可计算出每个未标记点的分类情况。

RW算法解释完毕。如读者有什么问题，可随意在评论区留言。