Jaccard 系数,又叫做Jaccard相似性系数,用来比较样本集中的相似性。Jaccard系数等于样本集交集与样本集合集的比值。
公式:
用来比较两个集合A和B的相似度。它可以用来比较文档相似度,示例:
英文资料:http://en.wikipedia.org/wiki/Jaccard_index
Jaccard 系数,又叫做Jaccard相似性系数,用来比较样本集中的相似性。Jaccard系数等于样本集交集与样本集合集的比值。
公式:
用来比较两个集合A和B的相似度。它可以用来比较文档相似度,示例:
英文资料:http://en.wikipedia.org/wiki/Jaccard_index