Jaccard指数也被称为并交比(Intersection over Union,简称iou)和Jaccard相似系数(Jaccard similarity coefficient)(Paul Jaccard最初创造的系数),是一个用于比较样本集的相似性和多样性的统计量。 Jaccard系数测量有限样本集合之间的相似性,并被定义为相交的大小除以样本集合的大小:
(如果A和B都是空的,我们定义J(A,B)= 1)
测量样本集之间不相似度的Jaccard距离与Jaccard系数是互补的,可以通过从1减去Jaccard系数获得,或者等价地,通过将并集的大小和交集的大小之差除以并集的大小:
Jaccard距离的另一种解释是对称差异的大小与两个集合并集的比率。
这个距离是收集所有有限集合的度量。[1] [2] [3]
Jaccard距离也有一个版本,包括概率测度。