论文阅读笔记《Template Matching with Deformable Diversity Similarity》

最新推荐文章于 2024-06-20 09:34:27 发布

深视

最新推荐文章于 2024-06-20 09:34:27 发布

阅读量1k

点赞数 1

分类专栏： # 图像匹配论文阅读笔记文章标签：图像匹配最近邻模板匹配

本文链接：https://blog.csdn.net/qq_36104364/article/details/115680401

版权

论文阅读笔记同时被 2 个专栏收录

259 篇文章 141 订阅

订阅专栏

图像匹配

41 篇文章 13 订阅

订阅专栏

文章介绍了一种针对图像模板匹配的无参数DDIS方法，它通过分析最近邻点集的多样性和变形程度来度量相似性。这种方法能有效处理遮挡和扭曲问题，但不适用于图像尺寸变化。DDIS包含两个度量函数，DIS衡量多样性，DDIS结合变形程度，用于目标定位。尽管存在局限，DDIS为模板匹配提供了新的思路。

摘要由CSDN通过智能技术生成

核心思想

该文提出一种应用于图像模板匹配的相似性度量方法，传统的模板匹配过程中，相似性度量通常采用距离平方和、归一化互相关等方法，但这些方法都很难处理遮挡、扭曲等复杂问题。因此，本文提出一种无参数的可变形多样性相似性度量方法（DDIS），该方法不是直接对图像进行处理，而是对模板与图像之间的最近邻点集（NNs）进行处理。假设 $p_i$ 表示模板中的图块（或者点）， $q_j$ 表示目标图像中的图块（或点），则需要从全部模板点集 $P$ 中为目标图像点集 $Q$ 中的每个点都找到最近邻点
在这里插入图片描述
其中 $d (q, p)$ 表示一种距离度量方法。如果模板与目标图像中的某个区域是匹配的，则他们之间的最近邻点集应该具备两个特点：多样性（Diversity）强，变形程度（deformation）小。所谓的多样性强就是指最近邻点集中的点都是唯一确定的，图像中的每个点在模板中都有唯一确定的最近邻点与之对应，实际中自然不会每个点都有唯一的最近邻点，但是这种一一对应关系应该是越多越好，如图(d)所示，每个箭头都指向不同的位置，表示不同点的最近邻点也各不相同。而对于不匹配的图像之间，他们的最近邻可能会指向同一个点，如图(e)所示，很多箭头都指向同一个位置，即很多点的最近邻点都是模板中的一个点。而变形程度小，则是说匹配图像中的点与模板上的最近邻点之间的位置变化应该是较小的，如图(d)中的箭头都很短，而不匹配图像中的点与模板中的最近邻点位置变化可能会很大，如图(e)中的箭头都很长。
在这里插入图片描述

明确了本文的思想之后，作者就设计了两个相似性度量函数用来描述最近邻点集的多样性和变形程度，作者首先设计了多样性相似性度量函数DIS
在这里插入图片描述
其中 $c=1/min\left \{M,N\right \}$ 表示归一化系数， $\left | \left \{\right \}\right |$ 表示计算集合内点的总数。DIS的值越大，则表示多样性越高。然后为了结合变形程度和多样性两个特点，作者又提出了可变形多样性相似性度量方法DDIS
在这里插入图片描述
其中

如果对于点 $q_j$ 只有唯一对应的最近邻点，则 $\kappa=1$ ，则DDIS中的指数项也达到最大值1。相反的，如果对于点 $q_j$ 与很多其他的点拥有相同最近邻点，则 $\kappa$ 的值会变大，则DDIS的指数项值下降。 $r_j$ 表示两个最近邻点的位置上的差异，如果点 $q_j$ 与最近邻点之间的位置差异很大，也会降低他对于相似性度量的影响比重， $r_j$ 可以看作是一个反比例权重系数。

实现过程

特征提取：包含颜色特征和深度特征，颜色特征就是RGB数值，深度特征则是利用VGG网络提取的特征向量
最近邻搜索：使用TreeCANN算法进行最近邻搜索，并配合PCA方法将维度压缩到9
相似性映射计算：对于目标图像中的每个像素都计算其所在的图块与模板之间的 $\kappa$ 值，由于相邻的像素之间，其图块会有重叠的部分，因此每次移动只计算，当前位置与上个位置对应 $\kappa$ 值的变化量
目标定位：最后模板的匹配目标定位在相似性得分最高的位置