前言
第二部分,有关于描述子的构建,似乎这个部分和上一个部分可以放在一起.....
正文
理论
首先,什么是描述子呢,描述子是从图像、音频、文本或其他数据中提取的一组数值特征,用于描述该数据的关键信息。在图像处理中,常常使用特征点检测算法(例如SIFT、SURF、ORB等)来检测图像中的关键点,然后计算这些关键点的描述子。这些描述子可以用于图像匹配、目标识别、图像检索等任务。在自然语言处理中,词嵌入(Word Embeddings)可以被视为描述文本数据的一种描述子,用于将单词映射到高维向量空间中。
总之我们总共也就讲了两种特征点,每种特征点都有对应的描述子,那么我们接下来就分成两种描述子算法来讲:
角点描述子
SIFT描述子
以下是对该算法构造特征点描述子的详细流程介绍:
1. 特征点检测和特征尺度确定:
首先,通过Harris角点检测等方法,检测出图像中的特征点。同时,确定每个特征点的特征尺度,这个尺度通常可以通过检测器算法得出,例如Harris角点检测器。
2. 邻域主方向的确定:
在每个特征点周围的邻域范围内,计算所有像素点的梯度方向。然后,构建一个0到2π范围的梯度方向直方图,选择具有最大频率的角度作为邻域主方向。这一步骤确保了特征点描述子的旋转不变性。
3. 特征点描述子的构建:
将特征点的邻域划分为一个4x4的网格,得到共16个小区域。在每个小区域内,计算像素的梯度方向,并构建一个长度为8的梯度方向直方图。因此,每个小区域的描述子是一个包含8个梯度方向的向量。将这些向量连接起来,形成一个长度为128的特征点描述子。(这里老师提问过)
4. 描述子的归一化:
最后,为了解决光照不变性问题,对构建好的特征点描述子进行归一化处理。归一化可以确保描述子在不同光照条件下保持一致性,增加了匹配的准确性。
通过以上步骤,我们得到了具有尺度不变性、旋转不变性和光照不变性的特征点描述子,这些描述子通常用于图像匹配、目标识别等计算机视觉任务中。
结语
总之,这个部分到此结束啦