CS131专题-5：图像特征——Harris角点

最新推荐文章于 2024-08-21 20:30:00 发布

⊙月

最新推荐文章于 2024-08-21 20:30:00 发布

阅读量2.7k

点赞数 2

分类专栏：斯坦福CS131 文章标签：计算机视觉 Harris角点

本文链接：https://blog.csdn.net/weixin_42118657/article/details/121462461

版权

斯坦福CS131 专栏收录该内容

8 篇文章 33 订阅

订阅专栏

1 图像特征

试想，从不同的距离，不同的方向、角度，不同的光照条件下观察一个物体时，物体的大小、形状、明暗都会有所不同。但我们依然可以判断它是同一个物体。这是因为什么呢？因为特征！

计算机视觉中常用的图像特征包括：点、边缘、以及特有的组件等等。

而其中点特征（不是指像素点，而是指图像中一个小局部）在视觉的各种任务中非常有用，如全景拼接、运动跟踪、物体识别等等。

为什么选择图像的点特征？

答：点特征作为图像特征之一的优势如下：

提取具有可重复性和准确性
- 不受图像平移、旋转、缩放变化的影响
- 对仿射变换也较为鲁棒
- 抗光照变化，噪声，模糊，量化
局部性：点特征属于局部特征，所以对图像遮挡有一定鲁棒性；
数量：通常图像中可以检测到成百上千的点特征，以量取胜；
辨识性：点特征有较好的辨识性，不同物体上的点容易区分；
效率：点特征提取通常速度很快；

一个基于特征点来实现图像匹配的神奇例子：

2 点特征——Harris角点

Harris算子是一种点特征提取算子，哈里斯+史蒂芬斯于1988年提出（是对Moravec角点检测算子的改进）。

2.1 角点

角点就是图像的“角落”位置，也是灰度值会发生突变的位置。“角点”特征相比“边缘”特征而言，在辨识性和信息量方面都具备很多优势，看下面这张图，你就知道为什么“角点”是一种好的特征。

如上图，当我们用一个窗口去和图像局部区域像素进行例如累加求和操作时，仅在“角点”位置其计算结果会与其临近的其他位置计算结果差异都比较大。

2.2 数学描述

为了得到角点的精确位置，以及量化是否是角点的概率值，需要对角点进行明确的数学描述。关于角点的上述性质的数学建模如下：

I(x, y)是：窗口移动前所覆盖的原图区的x,y位置的灰度值。注意：这个x,y坐标是相对此处这个窗口的坐标系而言，而元素值是图像的灰度值而不是窗口函数内元素值。
I(x+u, y+v)是：窗口在图像上移动[u, v]个单位后所覆盖的原图区的位置的灰度值，这个x,y同样是相对窗口的坐标系。
W(x, y)是：窗口函数，也就是权重系数，比如一个元素值全1的矩阵窗口，或者高斯核窗口。
遍历x,y累加求和中的x,y是什么：这里的x,y指的是窗口尺度的大小，假如窗口大小是10x10像素，那么公式里就要累加100个像素点位置的差值和。
E(u, v)是：简单说，E是一个二维矩阵，它存储的是窗口在图像上平移前后内部元素灰度值变化的差值。具体说，窗口在图像上平移[u, v]后，新窗口区域内像素值和平移之前窗口内像素值的对应位置的差的平方再乘以权重系数再累加之和。描述的有点拗口，语言不好整理，看下面这个可视化例子解释：

假设左边这个大图是某图像的一个局部区域，红色框是我们用于判定图像此处是否有角点的窗口，它是个初始位置。E(3, 2)意思是，这个红色窗口，移动[3,2]个单位，到达图像中绿色框位置，然后把两个框内像素的灰度值一个个的代入到上述公式中去计算加权累加和。

有个点注意：

E(0, 0)必定为0，即窗口没移动，所以对应位置像素值差全为0。
E(u, v)中元素值越大，代表两个位置窗口内情况差异越大。
Moravec角点检测用的全1权重窗口，而Harris角点检测用的高斯核窗口（中心点附近的差值权重大，边缘点附近的差值给的权重少）。

接下来不要忘记一个很重要的点（不然后面公式推导看不懂目的）：角点处是滑窗往任意方向移动变化量都大。所以，如果一个窗口内有角点，那么这个窗口往四周滑动计算出的 E(u, v) 矩阵，其除了E(0, 0)位置之外，E(u, v)矩阵中其他位置的元素值，必须都要足够大才行，有任何一个位置点值不大，都表示很可能不是角点了。

2.3 公式推导

为了能够直接观察到E(u,v)与[u,v]之间的联系，根据泰勒展开式，对公式推导优化如下：（https://zhuanlan.zhihu.com/p/90393907）

上述公式汇总，Ix, Iy是某个像素位置的图像偏导值。对它们的一些直观印象可如下：

如何通过矩阵判断角点的？

其实上面，我们已经推导出E(u,v)的表达式，大家看看这个表达式有什么特征，其中矩阵H是实对称矩阵，那么E表达式其实就是二次型，对于二次型想必大家会有印象，U,V代表窗口滑动方向以及滑动量，E代表灰度变化，通过矩阵M进行特征值求解，而特征值所对应的特征向量即为灰度变化方向。如果两个特征值较大，则表示有两个方向灰度变化较快。所以可以直接通过求解H的特征值进行角点判断。

如果线性代数知识忘了，可以看下面这种可视化解释：