72. 编辑距离
题目:https://leetcode-cn.com/problems/edit-distance/
难度困难
给你两个单词 word1
和 word2
,请你计算出将 word1
转换成 word2
所使用的最少操作数 。
你可以对一个单词进行如下三种操作:
- 插入一个字符
- 删除一个字符
- 替换一个字符
示例 1:
输入:word1 = "horse", word2 = "ros"
输出:3
解释:
horse -> rorse (将 'h' 替换为 'r')
rorse -> rose (删除 'r')
rose -> ros (删除 'e')
示例 2:
输入:word1 = "intention", word2 = "execution"
输出:5
解释:
intention -> inention (删除 't')
inention -> enention (将 'i' 替换为 'e')
enention -> exention (将 'n' 替换为 'x')
exention -> exection (将 'n' 替换为 'c')
exection -> execution (插入 'u')
提示:
0 <= word1.length, word2.length <= 500
word1
和word2
由小写英文字母组成
思路
LCS的思路
递归解法好理解
最简单的case怎么做?
别忘了base case
dp[i][j] 表示s1[0..i-1] 转换到 s2[0..j-1]需要的最小操作数 (插入、删除、替换)
def dp(i, j) -> int
# 返回 s1[0..i] 和 s2[0..j] 的最小编辑距离
dp[i-1][j-1]
# 存储 s1[0..i] 和 s2[0..j] 的最小编辑距离
有了之前递归解法的铺垫,应该很容易理解。dp 函数的 base case 是i,j
等于 -1,而数组索引至少是 0,所以 dp 数组会偏移一位,dp[..][0]
和dp[0][..]
对应 base case。。
那么怎么得到dp[i][j]
if s1[i]==s2[j] dp[i][j]=dp[i-1][j-1]
else dp[i][j]= min { 插入构造,删除构造,替换构造}+1
dp[i][j]= min { dp[i][j-1], dp[i-1][j], dp[i-1][j-1]}+1
如图 图片来自labuladong
代码:
//
#include <iostream>
#include <string>
#include <vector>
using namespace std;
int minDistance(string word1, string word2) {
int dp[510][510];//最小编辑距离 w1[0..i-1] w2[0..j-1]
//初始化base case
int s1=word1.size();
int s2=word2.size();
for(int i=0;i<=s1;i++) dp[i][0]=i;
for(int j=0;j<=s2;j++) dp[0][j]=j;
for(int i=1;i<=s1;i++){
for(int j=1;j<=s2;j++){
if(word1[i-1]==word2[j-1])
dp[i][j]=dp[i-1][j-1];
else{
int t=min(dp[i-1][j]+1,dp[i][j-1]+1); //删除 插入
dp[i][j]=min(t,dp[i-1][j-1]+1); //替换
}
}
}
return dp[s1][s2];
}
int main(){
string word1 = "horse", word2 = "ros";
cout<<minDistance(word1,word2);
return 0;
}