Jaccard Coefficient(Jaccard Similarity)

Set s and Set t

JC(s,t)=|s∪t|/|s∩t|


Java实现如下所示:


package ruc.database.similarity;

import java.util.ArrayList;
import java.util.List;

public class JaccardCoefficient {
	public static float jc(String s, String t)
	{
		String[] sSplit=s.split(" ");
		String[] tSplit=t.split(" ");
		
		//calculate intersection
		List<String> intersection=new ArrayList<String>();
		for(int i=0;i<sSplit.length;i++)
		{
			for(int j=0;j<tSplit.length;j++)
			{
				if(!intersection.contains(sSplit[i]))		//no duplicate
					if(sSplit[i].equals(tSplit[j]))			//has intersection
					{
						intersection.add(sSplit[i]);
						break;
					}
			}
		}
		
		//calculate union
		List<String> union=new ArrayList<String>();
		if(sSplit.length>tSplit.length)						//calculate big tupple first
		{
			for(int i=0;i<sSplit.length;i++)
				if(!union.contains(sSplit[i]))
					union.add(sSplit[i]);
			for(int i=0;i<tSplit.length;i++)
				if(!union.contains(tSplit[i]))
					union.add(tSplit[i]);
		}
		else
		{
			for(int i=0;i<tSplit.length;i++)
				if(!union.contains(tSplit[i]))
					union.add(tSplit[i]);
			for(int i=0;i<sSplit.length;i++)
				if(!union.contains(sSplit[i]))
					union.add(sSplit[i]);
			
		}
		
		return ((float)intersection.size())/((float)union.size());
	}
}


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值