72. 编辑距离
1、题目
给你两个单词 word1
和 word2
, 请返回将 word1
转换成 word2
所使用的最少操作数 。
你可以对一个单词进行如下三种操作:
- 插入一个字符
- 删除一个字符
- 替换一个字符
示例 1:
输入:word1 = "horse", word2 = "ros" 输出:3 解释: horse -> rorse (将 'h' 替换为 'r') rorse -> rose (删除 'r') rose -> ros (删除 'e')
示例 2:
输入:word1 = "intention", word2 = "execution" 输出:5 解释: intention -> inention (删除 't') inention -> enention (将 'i' 替换为 'e') enention -> exention (将 'n' 替换为 'x') exention -> exection (将 'n' 替换为 'c') exection -> execution (插入 'u')
提示:
0 <= word1.length, word2.length <= 500
word1
和word2
由小写英文字母组成
- 字符串
- 动态规划
2、题目分析
动态规划的解决套路可分为 2 步,①基于问题能定义出状态,②状态间具备动态规划的三个特性
①基于问题定义出状态:(参考该文完成分析:dp–139. 单词拆分 https://blog.csdn.net/fujuacm/article/details/135408092)
②状态间具备动态规划的三个特性(参考该文完成分析:dp–139. 单词拆分 https://blog.csdn.net/fujuacm/article/details/135408092)
- 重复子问题且重复策略
重复子问题: - 最优子结构
重复策略&最优子结构: - 无后效性
更前的状态不影响当前状态:
后面的状态不影响当前状态:
3、解题步骤
这道题的前提是只操作串1,而不是串1、串2都被操作
dp五部曲
1.定状态:(思考是否满足动规的3个特性)
dp数组:dp[n + 1][M + 1];
下标的含义:i,j表示截止到A串的第i字符,及截止到B串的第j字符,两串的最小编辑距离
2.推方程:(分场景推导方程)
若 A[i - 1] == B[j - 1],dp[i][j] = dp[i - 1][j - 1]; (若A串第i个字符、B串第j个字符相等,则当前2串的最小编辑距离 = A、B串各不包含i、j字符的子串的最小编辑距离)
若 A[i - 1] != B[j - 1],dp[i][j] = max(dp[i][j - 1], dp[i - 1][j], dp[i - 1][j - 1]) + 1 (若A串第i个字符、B串第j个字符 不相等,此时① dp[i][j - 1]表示在i位置后面插入字符;② dp[i - 1][j]表示把第i位置上的字符删除;③ dp[i - 1][j - 1]表示把第i位置上的字符替换为B串第j位置的字符)
3.初始化
dp数组第0行、及第0列随着下标的迁移递增。①表示当串2为空串时,对串1一直删减,使得串1=串2;②表示当串1不为空,串1为空时,对串1一直插入字符,使得串1=串2.
4.遍历
由第2点的状态转移方程可知,本状态可由3个方向的状态转移而来:左、上、左上。故i从小到大、j从小到大
5.举例
4、复杂度最优解代码示例
public int minDistance(String word1, String word2) {
int m = word1.length();
int n = word2.length();
// 创建二维数组dp,用于存储编辑距离
int[][] dp = new int[m + 1][n + 1];
// 初始化边界条件
// 初始化,踩坑,终止条件写成了i < m,此时dp最后一个位置未被成功初始化。后续遍历时,可以基于数组开辟的长度来考虑,若存在遍历逻辑,基本是遍历到数组结尾
for (int i = 0; i <= m; i++) {
// 当串2为空,串1不为空时,对串1一直做删减操作,使得串1=串2
dp[i][0] = i;
}
for (int j = 0; j <= n; j++) {
// 当串1为空,串2不为空时,对串1一直做插入操作,使得串1=串2
dp[0][j] = j;
}
// 动态规划计算编辑距离
for (int i = 1; i <= m; i++) {
for (int j = 1; j <= n; j++) {
if (word1.charAt(i - 1) == word2.charAt(j - 1)) {
// 如果两个字符相同,不需要操作,编辑距离与前一个状态相同
dp[i][j] = dp[i - 1][j - 1];
} else {
// 否则,需要对当前字符进行插入、删除或替换操作,取最小操作数
// 备注:若 A[i - 1] != B[j - 1],dp[i][j] = max(dp[i][j - 1], dp[i - 1][j], dp[i - 1][j - 1]) + 1 (若A串第i个字符、B串第j个字符 不相等,此时① dp[i][j - 1]表示在i位置后面插入字符;② dp[i - 1][j]表示把第i位置上的字符删除;③ dp[i - 1][j - 1]表示把第i位置上的字符替换为B串第j位置的字符)
dp[i][j] = Math.min(Math.min(dp[i - 1][j - 1], dp[i][j - 1]), dp[i - 1][j]) + 1;
}
}
}
// 返回编辑距离
return dp[m][n];
}
5、抽象与扩展
通用动态规划的解法,见标题二