一、编辑距离
- Levenshtein
距离,又称编辑距离,指的是两个字符串之间,由一个转换成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。编辑距离的算法是首先由俄国科学家Levenshtein 提出的,故又叫 Levenshtein Distance 。
eg:
字符串A: abcdefg
字符串B: abcdef
通过增加或是删掉字符 ”g” 的方式达到目的。这两种方案都需要一次操作。把这个操作所需要的次数定义为两个字符串的距离。
给定任意两个字符串,写出一个算法计算它们的编辑距离。
二、代码实现
package OneDaySuanFa;
public class EditDistance {
public static int editdistance(String str1,String str2){
int m = str1.length();
int n = str2.length();
char[] a = str1.toCharArray();
char[] b = str2.toCharArray();
int[][] dp = new int[m][n];
//dp[i][j]表示由字符串1的下标i转换成字符串2的下标j的编辑距离
for (int i = 0; i < m; i++){
if (a[i] == b[0]) dp[i][0] = i;
else if (i != 0) dp[i][0] = dp[i-1][0] + 1;
else dp[i][0] = 1;
}
for (int j = 0; j < n; j++){
if (a[0] == b[j]) dp[0][j] = j;
else if (j != 0) dp[0][j] = dp[0][j-1] + 1;
else dp[0][j] = 1;
}
for (int i = 0; i < m; i++){
for (int j = 0; j < n; j++){
if (a[i] == a[j]){
dp[i][j] = Math.min(
Math.min(dp[i-1][j] + 1, dp[i][j-1] + 1),dp[i-1][j-1]
);
}else {
dp[i][j] = Math.min(
Math.min(dp[i-1][j] + 1, dp[i][j-1] + 1),dp[i-1][j-1] + 1
);
}
}
}
return dp[m-1][n-1];
}
}