【DL经典回顾】距离度量大汇总(13-豪斯多夫距离(Hausdorff Distance))

【DL经典回顾】距离度量大汇总(13-豪斯多夫距离(Hausdorff Distance))


在深入探讨深度学习(DL)时,我们常常会发现,有些基础概念虽小,却影响深远。距离度量就是这样一个看似简单,实则至关重要的概念。它是机器学习和深度学习中不可或缺的一环,影响着模型的性能和应用的广泛性。在本专栏中,我们将进行一次深度的探索,回顾距离度量的各种方法,并理解它们的重要性和应用。

一、豪斯多夫距离(Hausdorff Distance)

1. 定义和公式

豪斯多夫距离(Hausdorff Distance)是度量两个点集之间相似度的指标,广泛用于计算机视觉、图像分析和几何形状比较中。给定两个点集 A A A B B B,豪斯多夫距离 d H ( A , B ) d_H(A, B) dH(A,B) 定义为:

d H ( A , B ) = max ⁡ { sup ⁡ a ∈ A inf ⁡ b ∈ B d ( a , b ) , sup ⁡ b ∈ B inf ⁡ a ∈ A d ( a , b ) } d_H(A, B)=\max \left\{\sup _{a \in A} \inf _{b \in B} d(a, b), \sup _{b \in B} \inf _{a \in A} d(a, b)\right\} dH(A,B)=max{aAsupbBinfd(a,b),bBsupaAinfd(a,b)}
其中, d ( a , b ) d(a, b) d(a,b) 是点 a a a 和点 b b b 之间的欧式距离。简而言之,豪斯多夫距离是点集 A A A 中的点到点集 B B B 的最近点之间距离的最大值,以及点集 B B B 中的点到点集 A A A 的最近点之间距离的最大值中较大的那个。
在这里插入图片描述

2. 函数特性

  • 对称性:豪斯多夫距离是对称的,即 d H ( A , B ) = d H ( B , A ) d_H(A, B) = d_H(B, A) dH(A,B)=dH(B,A)
  • 度量空间完备性:豪斯多夫距离在所有非空紧凑(有界且闭合)子集的度量空间中定义良好。
  • 对位移和旋转不变性:在不考虑缩放的情况下,豪斯多夫距离对平移和旋转是不变的。

3. 使用场景与局限性

使用场景
  • 计算机视觉和图像处理:在对象识别、形状分析和图像配准中,豪斯多夫距离被用于比较二维或三维空间中的几何形状。
  • 模式识别:豪斯多夫距离可用于评估模型生成的输出与实际数据之间的差异。
  • 地理信息系统(GIS):在GIS中,豪斯多夫距离可用于衡量地图特征之间的几何相似性。
局限性
  • 对噪声敏感:豪斯多夫距离对点集中的离群点非常敏感,因此可能会对噪声过于敏感。
  • 计算复杂性:对于大规模数据集,计算豪斯多夫距离可能会很耗时,因为它需要比较每个点对之间的距离。
  • 不考虑缩放:标准的豪斯多夫距离不对缩放做出调整,这意味着在实际应用中可能需要预处理数据以确保比较的公平性。

二、实现代码

from scipy.spatial.distance import directed_hausdorff
import numpy as np

def hausdorff_distance(setA, setB):
    """
    计算两个点集之间的豪斯多夫距离。
    
    参数:
    - setA: 点集A,一个N维数组,其中每一行代表一个点。
    - setB: 点集B,一个N维数组,其中每一行代表一个点。
    
    返回:
    - 两个点集之间的豪斯多夫距离。
    """
    # 计算有向豪斯多夫距离(从A到B和从B到A)
    dist_A_to_B = directed_hausdorff(setA, setB)[0]
    dist_B_to_A = directed_hausdorff(setB, setA)[0]
    
    # 取最大值作为真正的豪斯多夫距离
    hausdorff_dist = max(dist_A_to_B, dist_B_to_A)
    
    return hausdorff_dist

# 示例点集
setA = np.array([[1, 2], [2, 3], [3, 4]])
setB = np.array([[2, 2], [3, 3], [4, 4]])

# 计算豪斯多夫距离
distance = hausdorff_distance(setA, setB)
print("Hausdorff Distance:", distance)

代码解读:

  1. 引入必要的库:代码首先从scipy.spatial.distance导入directed_hausdorff函数,该函数用于计算两个点集之间的有向豪斯多夫距离。同时,引入numpy库以方便地处理点集数据。

  2. 定义函数:定义了一个名为hausdorff_distance的函数,接收两个N维数组setAsetB作为输入,这两个数组中的每一行代表一个点。

  3. 计算有向豪斯多夫距离:分别计算从setAsetB和从setBsetA的有向豪斯多夫距离。directed_hausdorff函数返回的是一个元组,其中第一个元素是距离值。

  4. 计算真正的豪斯多夫距离:取两个有向距离中的最大值作为两个点集之间的豪斯多夫距离。

  5. 输出结果:打印出计算得到的豪斯多夫距离。

注意事项:

  • 豪斯多夫距离对离群点非常敏感,因为它是基于点集间最大距离的度量。
  • 在使用directed_hausdorff函数时,应注意到它计算的是有向距离,所以需要检查两个方向并取最大值以得到真正的豪斯多夫距离。
  • 这种方法可以应用于二维或三维空间中的点集,使其在图像分析、计算机视觉等领域特别有用。

三、比较分析

与欧式距离的比较

  • 欧式距离是最常见的距离度量方法,它计算的是两点在多维空间中的直线距离。欧式距离适用于点到点的距离测量,通常用于连续数据。
  • 豪斯多夫距离计算的是两个点集中点到另一个集合中最近点的最大距离。它能够捕捉到两个形状之间的最大不同,而不仅仅是平均差异。
  • 适用场景:欧式距离适合于需要精确测量单个点之间距离的场景。豪斯多夫距离更适用于比较两个复杂几何形状或点云的相似性,如在计算机视觉和图像分析中比较两个图像的相似度。

与余弦相似度的比较

  • 余弦相似度衡量的是两个向量在方向上的相似性,而忽略它们的大小。它常用于文本分析和推荐系统中,以确定两个文档或用户偏好的相似程度。
  • 豪斯多夫距离与余弦相似度关注的维度不同,前者专注于空间中形状或点集的最大几何差异。
  • 适用场景:余弦相似度适合于需要衡量方向相似性而非大小的场景,特别是在文本数据上的应用。而豪斯多夫距离则适用于形状或轮廓匹配等需要考虑形状最大差异的领域。

与杰卡德相似系数的比较

  • 杰卡德相似系数基于集合理论,用于衡量两个集合的相似度,特别是在只关心元素是否出现的场景中。
  • 豪斯多夫距离关注的是几何形状或点集在空间中的最大差异,而与集合的元素是否存在无关。
  • 适用场景:杰卡德相似系数适合于处理分类数据或二元特征的相似性比较,如文档相似性或生态物种多样性分析。豪斯多夫距离更适用于图像处理、计算机视觉等领域,用于比较空间形状或轮廓。

四、参考

  1. “Shape Analysis and Classification: Theory and Practice” by Luciano da Fontoura Costa and Roberto Marcondes Cesar Junior:

    • 这本书提供了形状分析和分类的广泛覆盖,包括豪斯多夫距离在形状比较和分类中的应用。
  2. “Digital Image Processing” by Rafael C. Gonzalez and Richard E. Woods:

    • 尽管这本书的重点是图像处理的基本概念和技术,它也讨论了豪斯多夫距离等度量方法在图像分析和处理中的应用。
  3. “Computational Geometry: Algorithms and Applications” by Mark de Berg, Otfried Cheong, Marc van Kreveld, and Mark Overmars:

    • 本书在计算几何领域中提供了丰富的算法和应用,包括如何利用豪斯多夫距离来解决几何形状的比较问题。
  4. “Pattern Classification” by Richard O. Duda, Peter E. Hart, and David G. Stork:

    • 虽然这本书主要关注模式识别的理论和方法,但它也涉及到用于比较模式或对象的距离度量方法,包括豪斯多夫距离。
  • 21
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

夺命猪头

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值