给你两个单词 word1
和 word2
,请你计算出将 word1
转换成 word2
所使用的最少操作数 。
你可以对一个单词进行如下三种操作:
- 插入一个字符
- 删除一个字符
- 替换一个字符
示例 1:
输入:word1 = "horse", word2 = "ros" 输出:3 解释: horse -> rorse (将 'h' 替换为 'r') rorse -> rose (删除 'r') rose -> ros (删除 'e')
示例 2:
输入:word1 = "intention", word2 = "execution" 输出:5 解释: intention -> inention (删除 't') inention -> enention (将 'i' 替换为 'e') enention -> exention (将 'n' 替换为 'x') exention -> exection (将 'n' 替换为 'c') exection -> execution (插入 'u')
提示:
0 <= word1.length, word2.length <= 500
word1
和word2
由小写英文字母组成
编辑距离算法是用作机器翻译和语音识别评价标准的基本算法。
1、暴力枚举检查所有可能的编辑方法,取最短的一个。—— 所有可能的编辑方法达到指数级,并不需要进行这么多计算,只需要找到距离最短的序列而不是所有可能的序列。
2、动态规划
- 定义 dp[i][j]
- dp[i][j] 代表 word1 中前 i 个字符,变换到 word2 中前 j 个字符,最短需要操作的次数;
- 需要考虑 word1 或 word2 一个字母都没有,即全增加/删除的情况,预初始化 dp[0][j] 和 dp[i][0]
- 状态转移
- 增加,dp[i][j] = dp[i][j - 1] + 1
- 删除,dp[i][j] = dp[i - 1][j] + 1
- 替换,dp[i][j] = dp[i - 1][j - 1] + 1
- 按顺序计算,当计算 dp[i][j] 时,dp[i - 1][j] , dp[i][j - 1] , dp[i - 1][j - 1] 均已经确定了
- 配合增删改这三种操作,需要对应的 dp 把操作次数加一,取三种操作的最小结果
- 如果刚好这两个字母相同 word1[i-1] = word2[j-1] (元素下标超前一位),那么可以直接参考 dp[i - 1][j - 1] ,操作不用加一。
-
对于边界情况,一个空串和一个非空串的编辑距离为 dp[i][0] = i 和 dp[0][j] = j,dp[i][0] 相当于对 word1 执行 i 次删除操作,dp[0][j] 相当于对 word1执行 j 次插入操作(相当于对word2执行 j 次删除操作)。
- 复杂度分析
- 时间复杂度 :O(mn),其中 m 为 word1 的长度,n 为 word2 的长度。
- 空间复杂度 :O(mn),我们需要大小为 O(mn) 的 dp 数组来记录状态值。
1、如果 word1[0..i-1] 到 word2[0..j-1] 的变换需要消耗 k 步,那 word1[0..i] 到 word2[0..j] 的变换需要几步?
先使用 k 步,把 word1[0..i-1] 变换到 word2[0..j-1],消耗 k 步。再把 word1[i] 改成 word2[j],就行了。如果 word1[i] == word2[j],什么也不用做,一共消耗 k 步;否则需要替换,共消耗 k + 1 步。
2、如果 word1[0..i-1] 到 word2[0..j] 的变换需要消耗 k 步,那 word1[0..i] 到 word2[0..j] 的变换需要消耗几步?
先经过 k 步,把 word1[0..i-1] 变换到 word2[0..j],消耗掉 k 步,再把 word1[i] 删除,这样,word1[0..i] 就完全变成了 word2[0..j] ,共 k + 1 步。
3、如果 word1[0..i] 到 word2[0..j-1] 的变换需要消耗 k 步,那 word1[0..i] 到 word2[0..j] 的变换需要消耗几步?
先经过 k 步,把 word1[0..i] 变换成 word2[0..j-1],消耗掉 k 步,接下来,再插入一个字符 word2[j], word1[0..i] 就完全变成了 word2[0..j] 了。
总结:word1[0..i] 变换成 word2[0..j] 主要有三种方式,选择消耗最小的一种方式。
class Solution {
public int minDistance(String word1, String word2) {
int len_word1 = word1.length();
int len_word2 = word2.length();
// 建立动态规划的数组,预留为空字符串匹配时的结果
int[][] dp = new int [len_word1+1][len_word2+1];
for(int i = 0; i < dp.length; i ++){
dp[i][0] = i;
}
for(int j = 0; j < dp[0].length; j ++){
dp[0][j] = j;
}
for(int i = 1; i < dp.length; i ++){
for(int j = 1; j < dp[0].length; j ++){
// 此处注意下标,在建立dp数组时超前了一位
if(word1.charAt(i-1) == word2.charAt(j-1)){
dp[i][j] = dp[i-1][j-1];
}else{
dp[i][j] = Math.min(Math.min(dp[i-1][j], dp[i][j-1]), dp[i-1][j-1]) + 1;
}
}
}
return dp[len_word1][len_word2];
}
}