Levenshtein 距离,又称编辑距离,指的是两个字符串之间,由一个转换成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。编辑距离的算法是首先由俄国科学家 Levenshtein 提出的,故又叫 Levenshtein Distance 。
例如:
字符串A: abcdefg
字符串B: abcdef
通过增加或是删掉字符 ”g” 的方式达到目的。这两种方案都需要一次操作。把这个操作所需要的次数定义为两个字符串的距离。
import java.util.*;
public class Main {
public static void main(String[] args){
Scanner scan = new Scanner(System.in);
String str1 = scan.nextLine();
String str2 = scan.nextLine();
int n = str1.length();
int m = str2.length();
if(n == 0){
System.out.println(m);
return;
}
if(m == 0){
System.out.println(n);
return;
}
int[][] matrix = new int[n+1][m+1];
for(int x = 0; x < n; x++){
matrix[x][0] = x;
}
for(int y = 0; y < m; y++){
matrix[0][y] = y;
}
int eq = 0;
int tmp = 0;
for(int i = 1; i < n+1; i++){
for(int j = 1; j < m+1; j++){
if(str1.charAt(i-1) == str2.charAt(j-1)){
eq = 0;
} else {
eq = 1;
}
tmp = Math.min(matrix[i-1][j] + 1,matrix[i][j-1] + 1);
matrix[i][j] = Math.min(matrix[i-1][j-1] +eq,tmp);
}
}
System.out.println(matrix[n][m]);
}
}