计算机视觉(图形拼接总结2)

最新推荐文章于 2024-05-20 21:54:38 发布

chenjinxu2003

最新推荐文章于 2024-05-20 21:54:38 发布

阅读量36

点赞数

文章标签：计算机视觉人工智能

本文链接：https://blog.csdn.net/m0_73872315/article/details/134171704

版权

前言

第二部分,有关于描述子的构建,似乎这个部分和上一个部分可以放在一起.....

正文

理论

首先,什么是描述子呢,描述子是从图像、音频、文本或其他数据中提取的一组数值特征，用于描述该数据的关键信息。在图像处理中，常常使用特征点检测算法（例如SIFT、SURF、ORB等）来检测图像中的关键点，然后计算这些关键点的描述子。这些描述子可以用于图像匹配、目标识别、图像检索等任务。在自然语言处理中，词嵌入（Word Embeddings）可以被视为描述文本数据的一种描述子，用于将单词映射到高维向量空间中。

总之我们总共也就讲了两种特征点,每种特征点都有对应的描述子,那么我们接下来就分成两种描述子算法来讲:

角点描述子

角点描述子求法常常是以角点 x 为中心开一个 s*s 的窗口 W，然后基于 W 覆盖的

图像区域构造特征描述子 d。s 的大小一般是用户预先设定的。

最"坏"的描述子是块(block)描述子，它把W覆盖的区域拉成一个列向量并单位化。

块描述子不仅不具备“尺度不变性”，还不具备“旋转不变性”.

这种描述子的算法是先计算两张图像的各个描述子之间距离，方式有 SAD(L1 范数)，SSD(L2 范数)、 NNC(其实就是 1-pearson)。然后开始匹配，假设两张图像中的特征点描述子集合为 P,Q，

两个匹配上的特征点的描述子分别是pi,qj，则pi和qj应该满足： 1. dist(pi,qj)<threshold1，大于阈值； 2. dist(pi,qj)<dist(pi, any qk in Q),dist(pi,qj)<dist(any pk in P,qj)。 3. dist(pi,qj)/seciond_lowest_dist(pi,qk)>threshold2，不能模棱两可。