编辑距离算法(java)


package editDistance;
/**
 * 编辑距离(删除,添加,替换 得到相等字符串所需次数)算法
 * s = "eeba", t="abac"
 * 使用一个二维数组记录所需编辑次数(s为纵向,t为横向),
	0 1 2 3 4 
	1 1 2 3 4 
	2 2 2 3 4 
	3 3 2 3 4 
	4 3 3 2 3 
	第二列为当t取一个字符a的时候,s依次为  ""、"e"、"ee"、"eeb"、"eeba"所需的编辑距离
	其余的类似
	以动态规划角度来看,以edit(i,j)来代表矩阵中的元素,其意义为i代表s取前i个字符,j代表t取前个字符
	如edit(2,2)代表s="ee",t="ab"的编辑距离,在矩阵中为2(代码中还有一个0行)
	edit(i,j)=minist(edit(i,j-1)+1, edit(i-1,j)+1, edit(i-1,j-1)+cost)
	edit(2,2)=minist(edit(2,1)+1, edit(1,2)+1, edit(1,1)+cost)
	即取("ee","a")("e","ab")("ee","ab")三个编辑距离中的最小值
	s.charAt(i-1)==t.charAt(j-1)时,cost=1
 * @author yanjie
 *
 */
public class EditDistance {
	
	public static void main(String[] args) {
		String s = "eeba", t="abac";
		int d = getEditDistance(s, t);
		System.out.println(d);
	}
	//返回三者最小值
    private static int Minimum(int a, int b, int c) {
    	int im =  a<b ? a : b;
    	return im<c ? im : c;
    }
   
    public static int getEditDistance(String s, String t) {
        int d[][]; // matrix
        int n; // length of s
        int m; // length of t
        int i; // iterates through s
        int j; // iterates through t
        char s_i; // ith character of s
        char t_j; // jth character of t
        int cost; // cost
        
        // Step 1
        n = s.length();
        m = t.length();
        if (n == 0) {
            return m;
        }
        if (m == 0) {
            return n;
        }
        d = new int[n + 1][m + 1];
        
        // Step 2
        for (i = 0; i <= n; i++) {
            d[i][0] = i;
        }
        for (j = 0; j <= m; j++) {
            d[0][j] = j;
        }
        
        // Step 3
        for (i = 1; i <= n; i++) {
            s_i = s.charAt(i - 1);
            // Step 4
            for (j = 1; j <= m; j++) {
                t_j = t.charAt(j - 1);
                // Step 5
                cost = (s_i == t_j) ? 0 : 1;
                // Step 6
                d[i][j] = Minimum(d[i - 1][j] + 1, d[i][j - 1] + 1,
                        d[i - 1][j - 1] + cost);
            }
        }
        // Step 7
        print(d, m, n);
        return d[n][m];
    }
    public static void print(int d[][],int m, int n){
    	for (int i = 0; i <= n; i++) {
            for (int j = 0; j <= m; j++) {
            	System.out.print(d[i][j]+" ");
            }
            System.out.println();
    	}
    }
}

参考http://hxraid.iteye.com/blog/615469

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值