理解Harris角点检测的数学原理与简单理解SIFT

jmu xzh_0618

已于 2024-03-31 16:45:45 修改

阅读量722

点赞数 10

分类专栏：计算机视觉文章标签：计算机视觉图像处理算法

于 2024-03-26 17:12:16 首次发布

本文链接：https://blog.csdn.net/m0_61281610/article/details/137046596

版权

计算机视觉专栏收录该内容

4 篇文章 0 订阅

订阅专栏

文章深入解析了Harris角点检测的数学原理，通过构建基于图像梯度的二次型函数来量化灰度变化，展示了如何使用Harris响应函数来检测角点。同时，文章介绍了SIFT算法的简单理解，包括尺度空间极值检测、关键点定位、方向赋值和关键点描述，强调了其在图像处理中的旋转不变性和稳定性。

摘要由CSDN通过智能技术生成

Harris角点检测的数学原理与简单理解SIFT

Harris角点检测基于图像的局部自相似性，它通过分析图像窗口在各个方向上移动时灰度变化的程度来识别角点,它通过计算每个像素点的Harris响应值来评估该点是否为角点。数学上，这种变化可以通过构建一个二次型函数来量化，该函数基于图像在x和y方向上的一阶导数（即图像的梯度），以及梯度的二次项的组合。

一、数学题目第一题

假设我们有一个图像区域的灰度函数 $I (x, y)$ ，其中 $x, y$ 分别是图像上的横纵坐标。我们对 $I (x, y)$ 在点 $x_0, y_0)$ 附近进行泰勒展开，忽略二阶及以上项，考虑一个小窗口移动了 $(\Delta x, \Delta y)$ 后的灰度变化 $E(\Delta x, \Delta y)$ ：

$E(\Delta x, \Delta y) = \sum_{x, y} w(x, y) [I(x + \Delta x, y + \Delta y) - I(x, y)]^2$

其中， $w (x, y)$ 是窗口函数，通常为高斯窗口，用于给窗口内的像素点赋予权重。

请简化上述 $E(\Delta x, \Delta y)$ 表达式，展示如何利用图像的梯度（ $I_x, I_y$ ）和高斯权重来近似计算 $E(\Delta x, \Delta y)$ 。
说明Harris角点检测中“角点”的数学特性是什么？
如果给定一个简单的图像区域，其中 $I_x = \begin{bmatrix} 1 & 0 \\ 0 & -1 \end{bmatrix}$ 和 $I_y = \begin{bmatrix} 0 & 1 \\ -1 & 0 \end{bmatrix}$ ，并假设 $w (x, y) = 1$ （即不考虑权重），求该区域的Harris响应函数值。

解答过程

简化 $E(\Delta x, \Delta y)$ ：

通过泰勒展开，我们可以得到：

$\Delta x, y + \Delta y) \approx I(x, y) + I_x(x, y) \Delta x + I_y(x, y) \Delta y$

将其代入 $E(\Delta x, \Delta y)$ 的表达式中，并简化：

$E(\Delta x, \Delta y) \approx \sum_{x, y} w(x, y) [I_x \Delta x + I_y \Delta y]^2$
Harris角点的数学特性：

Harris角点检测通过构造矩阵 $M$ 来分析 $E(\Delta x, \Delta y)$ ，矩阵 $M$ 定义为图像梯度的二次型形式：

$\sum_{x, y} w(x, y) \begin{bmatrix} I_x^2 & I_x I_y \\ I_x I_y & I_y^2 \end{bmatrix}$

角点的特性是在多个方向上移动窗口时，都会引起较大的灰度变化。数学上，这意味着矩阵 $M$ 的两个特征值都应该较大。
求Harris响应函数值：

首先计算矩阵 $M$ ：

$\sum_{x, y}\begin{bmatrix} I_x^2 & I_x I_y \\ I_x I_y & I_y^2 \end{bmatrix} = \begin{bmatrix} 2 & 0 \\ 0 & 2 \end{bmatrix}$

Harris响应函数 $R$ 定义为：

$\text{det}(M) - k \cdot (\text{trace}(M))^2$

其中， $\text{det}(M)$ 是矩阵 $M$ 的行列式， $\text{trace}(M)$ 是 $M$ 的迹（即对角线元素之和）， $k$ 是经验常数，通常取值在0.04到0.06之间。

对于给定的矩阵 $\begin{bmatrix} 2 & 0 \\ 0 & 2 \end{bmatrix}$ ：

$\text{det}(M) = 2 \times 2 - 0 = 4$
$\text{trace}(M) = 2 + 2 = 4$

假设 $k = 0.04$ （作为一个例子），我们可以计算 $R$ 的值：

$\cdot (4)^2 = 4 - 0.64 = 3.36$

解释

此结果表示，对于给定的图像区域和简化的条件，其Harris响应值为3.36。在实际应用中，Harris响应值用于衡量每个像素点作为角点的可能性。较高的响应值表示该点更有可能是角点。在角点检测过程中，会设置一个阈值，只有当 $R$ 的值高于这个阈值时，相应的点才被认为是角点。

通过这个简单的数学题目，我们可以看到Harris角点检测的基本思想是通过分析图像在小区域内的灰度变化来识别角点。构造的矩阵 $M$ 反映了图像在该小区域内的梯度分布情况，而Harris响应函数则是基于 $M$ 的特征值来评估每个点作为角点的可能性。这种方法能有效地检测到图像中的角点，对于图像特征提取和后续的图像匹配等任务具有重要意义。

二、数学题目第二题

假设在一个小的图像窗口内，我们有以下图像的梯度矩阵 $I_x$ 和 $I_y$ （分别表示图像在x和y方向上的梯度）:

$I_x = \begin{bmatrix} -1 & 0 & 1 \\ -2 & 0 & 2 \\ -1 & 0 & 1 \end{bmatrix}, \quad I_y = \begin{bmatrix} -1 & -2 & -1 \\ 0 & 0 & 0 \\ 1 & 2 & 1 \end{bmatrix}$

计算图像窗口的梯度矩阵 $I_x$ 和 $I_y$ 的各自平方和互乘得到的矩阵 $A$ , $B$ , 和 $C$ ，其中 $A = I_x^2$ , $I_x \cdot I_y$ , $C = I_y^2$ 。
假设窗口函数 $w (x, y) = 1$ （即不考虑权重），计算矩阵 $M$ 的行列式 $\text{det}(M)$ 和迹 $\text{trace}(M)$ ，其中 $\sum w(x, y) \begin{bmatrix} A & B \\ B & C \end{bmatrix}$ 。
根据Harris响应函数 $\text{det}(M) - k \cdot (\text{trace}(M))^2$ ，取 $k = 0.04$ ，计算 $R$ 。

解答过程

计算 $A$ , $B$ , 和 $C$ ：
- $\sum (I_x)^2$ ，表示 $I_x$ 的每个元素平方后的总和。
- $\sum (I_x \cdot I_y)$ ，表示 $I_x$ 和 $I_y$ 对应元素乘积的总和。
- $\sum (I_y)^2$ ，表示 $I_y$ 的每个元素平方后的总和。
$I_x^2 = \begin{bmatrix} 1 & 0 & 1 \\ 4 & 0 & 4 \\ 1 & 0 & 1 \end{bmatrix}$

$I_x \cdot I_y = \begin{bmatrix} 1 & 0 & -1 \\ 0 & 0 & 0 \\ -1 & 0 & 1 \end{bmatrix}$

$I_y^2 = \begin{bmatrix} 1 & 4 & 1 \\ 0 & 0 & 0 \\ 1 & 4 & 1 \end{bmatrix}$
计算 $M$ , $\text{det}(M)$ 和 $\text{trace}(M)$ ：

由于 $w (x, y) = 1$ ，我们直接对 $A$ , $B$ , 和 $C$ 进行求和得到 $M$ 的各个元素：

$\sum A = 12, \quad \sum B = 0, \quad \sum C = 12$

因此，

$\begin{bmatrix} 12 & 0 \\ 0 & 12 \end{bmatrix}$

$\text{det}(M) = 12 \times 12 - 0 = 144$

$\text{trace}(M) = 12 + 12 = 24$
计算Harris响应函数 $R$ ：

根据 $\text{det}(M) - k \cdot (\text{trace}(M))^2$ ，将 $\text{det}(M)$ 和 $\text{trace}(M)$ 的值代入，取 $k = 0.04$ ：

$\times (24)^2 = 144 - 0.04 \times 576 = 144 - 23.04 = 120.96$

解释

所以，对于给定的图像梯度矩阵，Harris响应值 $R$ 为 120.96。这个结果说明，在考虑的窗口内，与 $R$ 相关的像素点具有较高的角点特征。在实际应用中，通过比较不同点的 $R$ 值，可以识别出图像中的角点。角点的识别基于这样一个事实：角点处的图像灰度变化在多个方向上都很大，导致其对应的Harris响应值较大。对于非角点（如边缘或平坦区域），其Harris响应值通常较小。

此数学题目通过计算一个简化版的Harris响应值来展示Harris角点检测算法的基本思想。这种方法通过分析图像梯度的分布来检测角点，是计算机视觉中广泛应用的一种特征提取技术。通过此题目，我们可以更好地理解Harris角点检测背后的数学原理，以及如何通过这种方法来识别图像中的角点。

三、简单理解SIFT

SIFT，全称为尺度不变特征变换（Scale-Invariant Feature Transform），是一种用于图像处理领域的算法，主要用于识别和描述图像中的局部特征。简单来说，SIFT帮助我们找到图像中的“关键点”（比如角点、边缘等），并且对每个关键点提供一个描述符，这个描述符能够详细描述该点周围的图像信息。

理解SIFT算法，我们可以分成以下几个简单的步骤：