Levenshtein 距离,又称编辑距离,指的是两个字符串之间,由一个转换成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。编辑距离的算法是首先由俄国科学家Levenshtein提出的,故又叫Levenshtein Distance。
Ex:
字符串A:abcdefg
字符串B: abcdef
通过增加或是删掉字符”g”的方式达到目的。这两种方案都需要一次操作。把这个操作所需要的次数定义为两个字符串的距离。
要求:
给定任意两个字符串,写出一个算法计算它们的编辑距离。
import java.util.*;
public class Main {
public static void main(String[] args) {
Scanner input = new Scanner(System.in);
while(input.hasNext()){
String str1 = input.nextLine();
String str2 = input.nextLine();
System.out.println(distance(str1, str2));
}
}
public static int distance(String string1, String string2){
char [] str1 = string1.toCharArray();
char [] str2 = string2.toCharArray();
int [][] dp = new int[str1.length + 1][str2.length + 1];
for(int i = 0; i <= str1.length ; i++)
dp[i][0] = i;
for(int i = 0; i <= str2.length ; i++)
dp[0][i] = i;
for(int i = 1; i <= str1.length; i++){
for(int j = 1; j<= str2.length; j++){
if(str1[i - 1] == str2[j - 1]){
dp[i][j] = dp[i - 1][j - 1];
}else{
dp[i][j] = min(dp[i - 1][j], dp[i][j - 1], dp[i - 1][j - 1]) + 1;
}
}
}
return dp[str1.length][str2.length];
}
private static int min(int a, int b, int c){
return Math.min(Math.min(a, b), c);
}
}