编辑距离,又称Levenshtein距离,是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。
例如将kitten一字转成sitting:
- sitten (k→s)
- sittin (e→i)
- sitting (→g)
俄罗斯科学家Vladimir Levenshtein在1965年提出这个概念。
问题:找出字符串的编辑距离,即把一个字符串s1最少经过多少步操作变成编程字符串s2,操作有三种,添加一个字符,删除一个字符,修改一个字符
http://www.cnblogs.com/biyeymyhjob/archive/2012/09/28/2707343.html
public int minDistance(String word1, String word2) {
int len1 = word1.length();
int len2 = word2.length();
int temp1,temp2,temp3;
int[][] distance = new int[len1+1][len2+1];
for(int i = 0; i <= len2; i++){
distance[0][i] = i;
}
for(int i = 1; i <= len1; i++){
distance[i][0] = i;
}
for(int i = 1; i <=len1; i++){
for(int j = 1; j <= len2; j++){
temp1 = distance[i-1][j] + 1;
temp2 = distance[i][j-1] + 1;
if(word1.charAt(i-1) == word2.charAt(j-1)){
temp3 = distance[i-1][j-1];
}else{
temp3 = distance[i-1][j-1] + 1;
}
distance[i][j] = minInThree(temp1, temp2, temp3);
}
}
return distance[len1][len2];
}
private int minInThree(int num1, int num2, int num3){
if(num1<= num2){
if(num1 <= num3){
return num1;
}else{
return num3;
}
}else{
if(num2 <= num3){
return num2;
}else{
return num3;
}
}
}