题目来源:https://leetcode-cn.com/problems/edit-distance/
大致题意:
给两个字符串,每次可以对其中一个字符串做以下操作:
- 删除一个字符
- 添加一个字符
- 修改一个字符
求最少需要多少次操作可以使两个字符串相同
思路
可知
- 对一个字符串进行删除字符操作,等价于对另一个字符串进行添加字符操作
设给的字符串为 A、B,长度为 l1、l2,于是实际上的操作有三种:
- 对字符串 A 添加一个字符
- 对字符串 B 添加一个字符
- 修改 A 或 B 的一个字符
A 和 B 的编辑距离与前缀子串的编辑距离和当前字符相关,若使用 dp[i][j] 表示 A 的前 i 个字符与 B 的前 j 个字符的编辑距离,那么有:
- dp[i][j - 1] 为 A 的前 i 个字符与 B 的前 j - 1 个字符的编辑距离,若在 A 的子串后添加 B 的第 j 个字符,那么 dp[i][j] 即为 dp[i][j - 1] + 1
- dp[i - 1][j] 为 A 的前 i - 1 个字符与 B 的前 j 个字符的编辑距离,若在 B 的子串后添加 A 的第 i 个字符,那么 dp[i][j] 即为 dp[i - 1][j] + 1
- dp[i - 1][j - 1] 为 A 的前 i - 1 个字符与 B 的前 j - 1 个字符的编辑距离,若 A 的第 i 个字符与 B 的第 j 个字符相等,那么 dp[i][j] 即为 dp[i - 1][j - 1];若不相等,修改其中一个与另一个相等,那么 dp[i][j] 即为 dp[i - 1][j - 1] + 1
- 综上,若 A 的第 i 个字符与 B 的第 j 个字符相等,
dp[i][j] = min(dp[i][j - 1] + 1, dp[i - 1][j] + 1, dp[i - 1][j - 1])
;若不相等dp[i][j] = min(dp[i][j - 1] + 1, dp[i - 1][j] + 1, dp[i - 1][j - 1] + 1)
可以知道,若 i 或者 j 其中一个为 0,那么 dp[i][j] 即为非 0 的索引值;若都为 0,编辑距离即为 0
最终 dp[l1][l2] 即为答案
具体看代码:
public int minDistance(String word1, String word2) {
int m = word1.length();
int n = word2.length();
int[][] dp = new int[m + 1][n + 1];
for (int i = 0; i < m + 1; i++) {
for (int j = 0; j < n + 1; j++) {
// 若有 0,那么距离即为非 0 的索引值
// 都为 0,距离也为 0
if (i == 0 || j == 0) {
dp[i][j] = i == 0 ? j : i;
continue;
}
// 若 word1 第 i 个字符与 word2 的第 j 个字符相等
if (word1.charAt(i - 1) == word2.charAt(j - 1)) {
dp[i][j] = 1 + Math.min(dp[i - 1][j - 1] - 1, Math.min(dp[i - 1][j], dp[i][j - 1]));
} else {
dp[i][j] = 1 + Math.min(dp[i - 1][j - 1], Math.min(dp[i - 1][j], dp[i][j - 1]));
}
}
}
return dp[m][n];
}