一、杰卡德系数定义
给定两个集合A,B,杰卡德系数(Jaccard Coefficient)定义为A与B交集的大小与A与B并集的大小的比值,如下:
二、图形表示
三、应用
由于其作用是比较集合的相似度,因此应用的场景主要是离散符号,例如文本(字符集合),只要数据是可以使用集合表示,那么就可以用Jaccard系数来衡量数据之间的相似度。然而,又由于集合的特点是不可重复且无序,尤其是无序,因此数据如果转化为集合表示后,就会丢失数据原本的顺序信息。
给定两个集合A,B,杰卡德系数(Jaccard Coefficient)定义为A与B交集的大小与A与B并集的大小的比值,如下:
由于其作用是比较集合的相似度,因此应用的场景主要是离散符号,例如文本(字符集合),只要数据是可以使用集合表示,那么就可以用Jaccard系数来衡量数据之间的相似度。然而,又由于集合的特点是不可重复且无序,尤其是无序,因此数据如果转化为集合表示后,就会丢失数据原本的顺序信息。