问题:
给定两个字符串s1和s2,计算出将s1转换成s2所使用的最少操作次数。有如下三种操作:
1、插入一个字符
2、删除一个字符
3、修改一个字符
实例:
输入s1 = '"horse" s2 = "ros"
输出 :3
解释:
horse ->rorse(将h换成r)
rorse ->rose(删除r)
rose ->ros(删除e)
思路:
解决两个字符串的dp问题,一般用两个指针 i,j 分别指向两个字符串的最后,然后逐步向前走,缩小问题的规模。
对于这个问题,指向的字符有两大类情况:
1、当指向的字符相同,即s1[i] == s2[j]。因为这两个字符相同,为了使得编辑距离最小,不应该对其有任何操作, i,j 指针向前走。
2、当指向的字符不相同,即s1[i] != s2[j]。需要通过三种操作使得指向的字符相同。
①添加操作:在指针 i 指向s1的字符后添加一个字符s2[j],此时指向s2的指针 j 要向前走,指向s1的指针 i 不动。
②删除操作:删除指针 i 指向s1的字符,指针 i 向前走,指针 j 不动。
③替换操作:将指针 i 指向s1的字符替换成字符s2[j],则指针 i,j 应该都想前走。
最后,当其中一个字符的指针 i 或 j 走完,比如 i 走完,只需删除s2的剩余字符即可完成操作。
递归公式:用dp[i-1][j-1]存储s1[0..i]和s2[0..j]的最小编辑距离
dp[i][0] = i //当 s2为空字符串
dp[0][j] = j //当 s1为空字符串
//当 s1和s2不是空字符串
如果s1[i] == s2[j],则dp[i][j] = dp[i-1][j-1]
如果s1[i] != s2[j],则dp[i][j] = min(dp[i][j-1]+1, dp[i-1][j]+1, dp[i-1][j-1]+1) //三种操作的最少操作次数
代码:
#include <iostream>
#include <string.h>
using namespace std;
int dp[10][10];
int minimum(int a, int b, int c){
return min(min(a,b),c);
}
int minDistance(string s1, string s2){
int m = s1.size(), n = s2.size();
// s2为空字符
for(int i = 1; i <= m; i++) dp[i][0] = i;
// s1为空字符
for(int i = 1; i <= n; i++) dp[0][i] = i;
// s1和s2不为空
for(int i = 1; i <= m; i++) {
for(int j = 1; j <= n; j++){
if(s1[i-1] == s2[j-1]) dp[i][j] = dp[i-1][j-1]; //当前索引i,j指向的字符相同
else{
// 当前索引i,j指向的字符不相同,选择操作次数最少的操作
dp[i][j] = minimum(dp[i][j-1]+1, dp[i-1][j]+1,dp[i-1][j-1]+1);
}
}
}
return dp[m][n];
}
int main(){
string s1, s2;
cout<<"字符串s1:"; cin>>s1;
cout<<"字符串s2:"; cin>>s2;
memset(dp,0,sizeof(dp));
minDistance(s1,s2);
cout<<"s1和s2的最小编辑距离:"<<dp[s1.size()][s2.size()]<<endl;
return 0;
}
测试结果: