第八次作业Kendall's tau相似程度指标NO.3

两个序列,例如S1 = {a, b, c, d}、 S2 = {a, c, b, d},如何度量它们的相似程度,有很重要的应用背景,在投票决策、表达式搜索、top-k比较、乃至搜索引擎优化等问题上有广泛的应用ref1,ref2。Kendall's tau则是其中一种度量指标。由同样元素组成,只是元素的排列顺序不同的两个序列,如果其顺序完全一致,则Kendall's tau值为1,如果完全反序其Kendall's tau值为0。

Kendall's tau具体的计算方式为:

1 - 2.0*reversions / (n * (n -1)),

其中n为序列本身的长度(两个序列的长度相同),reversions为逆序对的个数。

逆序对的计算方法是: 对于两个给定的序列S1 = {a, b, c, d}和S2 = {a, c, b, d}。分别找出两个序列的二元约束集。在这个例子中S1的所有二元约束集为{(a,b), (a,c), (a,d), (b,c), (b,d), (c,d)},S2的所有二元约束集为{(a,c), (a,b), (a,d), (c,b), (c,d), (b,d)}。比较两个二元约束集,其中不同的二元约束是(b,c)和(c,b),即逆序对的个数为1。

代入上面的计算公式可以得到这两个序列的Kendall's tau指标为:

1 - 2. * 1 / (4 * 3)  = 2. / 3 = 0.833

输入:

两个由同样元素组成的序列,每行一个。序列长度一致,只是元素的排列顺序不同,里面的元素不重复。

输出:

对应的Kendall's tau指标值,保留到小数点后3位("%.3f\n")

样例输入:

a,b,c,d

a,c,b,d

样例输出:

0.833

import java.util.Scanner;
/*
 * Kendall's tau相似程度指标
 */
public class Main {
    public static int getRev(String [] inStr1, String [] inStr2){
    	int n = inStr1.length;
    	String [] res1 = new String[(n-1)*n/2];
    	String [] res2 = new String[(n-1)*n/2];
    	for(int i=0,h=0;i<n-1;i++){
    		for(int j=i+1;j<n;j++){
    			res1[h] = inStr1[i]+inStr1[j];
    			res2[h++] = inStr2[i]+inStr2[j];
    		}
    	}
    	int reverse = 0;
    	for(int i=0;i<res1.length;i++){
    		for(int j=0;j<res2.length;j++){
    			if(res1[i].equals(res2[j])){
    				reverse++;
    			}
    		}
    	}
    	return res1.length - reverse;    	
    }
	public static void main(String[] args) {
		Scanner in = new Scanner(System.in);
        String S1 = in.nextLine();
        String S2 = in.nextLine();
        String [] inStr1 = S1.split(",");
        String [] inStr2 = S2.split(",");
        int n = inStr1.length;
        int reversions = getRev(inStr1,inStr2);
        double val = 1 - 2.0*reversions/(n*(n-1));
        System.out.printf("%.3f\n",val);
	}
}


 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值