杰卡德距离(Jaccard Distance)是用来衡量两个集合差异性的一种指标,它是杰卡德相似系数的补集,被定义为1减去Jaccard相似系数。而杰卡德相似系数(Jaccard similarity coefficient),也称杰卡德指数(Jaccard Index),是用来衡量两个集合相似度的一种指标。杰卡德指数最早由瑞士苏黎世联邦理工学院的植物学和植物生理学教授保罗·杰卡德(Paul Jaccard)提出。
假设A和B是两个集合(如上图所示),那么二者之间的杰卡德指数就定义为:
特别地,如果A和B都是空集,则规定J(A,B)=1;并且有 Jaccard Distance = 1 - Jaccard Index。
杰卡德指数或杰卡德距离在机器学习、数据科学、自然语言处理、计算机视觉等领域有着广泛的应用。例如,在计算机视觉