在计算机科学中,编辑距离是一种通过计算将一个字符串转换为另一个字符串所需的最小操作数来量化两个字符串(例如单词)彼此之间的相异程度的方法。
一个单词允许进行三种操作:替换,删除,插入。例如,“ a”和“ b”之间的编辑距离为1,“ abc”和“ def”之间的编辑距离为3。这篇文章分析了如何使用动态编程来计算编辑距离。
关键分析
令dp [i] [j]代表两个长度为i和j的字符串之间的编辑距离,即word1 [0,…,i-1]和word2 [0,…,j-1]。
dp [i] [j]和dp [i-1] [j-1]之间存在关系。假设我们从一个字符串转换为另一个字符串。第一个字符串的长度为i,最后一个字符为“ x”;第二个字符串的长度为j,最后一个字符为“ y”。下图显示了这种关系。
1.如果x == y,则dp [i] [j] == dp [i-1] [j-1]
2.如果x!= y,我们为单词1插入y,则dp [i] [j] = dp [i] [j-1] + 1
3.如果x!= y,我们删除单词1的x,则dp [i] [j] = dp [i-1] [j] + 1
4.如果x!= y,并且我们用word的y替换x,则dp [i] [j] = dp [i-1] [j-1] + 1
5.当x!= y时,dp [i] [j]是这三种情况的最小值。
初始条件:
dp [i] [0] = i,dp [0] [j] = j
Java解决方案1-迭代
经过上面的分析,代码只是它的表示。
public static int minDistance(String word1, String word2) {
int len1 = word1.length();
int len2 = word2.length();
// len1+1, len2+1, because finally return dp[len1][len2]
int[][] dp = new int[len1 + 1][len2 + 1];
for (int i = 0; i <= len1; i++) {
dp[i][0] = i;
}
for (int j = 0; j <= len2; j++) {
dp[0][j] = j;
}
//iterate though, and check last char
for (int i = 0; i < len1; i++) {
char c1 = word1.charAt(i);
for (int j = 0; j < len2; j++) {
char c2 = word2.charAt(j);
//if last two chars equal
if (c1 == c2) {
//update dp value for +1 length
dp[i + 1][j + 1] = dp[i][j];
} else {
int replace = dp[i][j] + 1;
int insert = dp[i][j + 1] + 1;
int delete = dp[i + 1][j] + 1;
int min = replace > insert ? insert : replace;
min = delete > min ? min : delete;
dp[i + 1][j + 1] = min;
}
}
}
return dp[len1][len2];}
Java解决方案2-递归
我们可以递归地编写解决方案。
public int minDistance(String word1, String word2) {
int m=word1.length();
int n=word2.length();
int[][] mem = new int[m][n];
for(int[] arr: mem){
Arrays.fill(arr, -1);
}
return calDistance(word1, word2, mem, m-1, n-1);}
private int calDistance(String word1, String word2, int[][] mem, int i, int j){
if(i<0){
return j+1;
}else if(j<0){
return i+1;
}
if(mem[i][j]!=-1){
return mem[i][j];
}
if(word1.charAt(i)==word2.charAt(j)){
mem[i][j]=calDistance(word1, word2, mem, i-1, j-1);
}else{
int prevMin = Math.min(calDistance(word1, word2, mem, i, j-1), calDistance(word1, word2, mem, i-1, j));
prevMin = Math.min(prevMin, calDistance(word1, word2, mem, i-1, j-1));
mem[i][j]=1+prevMin;
}
return mem[i][j]; }
最后,开发这么多年我也总结了一套学习Java的资料与面试题,如果你在技术上面想提升自己的话,可以关注我,私信发送领取资料或者在评论区留下自己的联系方式,有时间记得帮我点下转发让跟多的人看到哦。