计算字符串距离
描述
对于两个不同的字符串,我们有一套操作方法来把他们变得相同,具体方法为:
修改一个字符(如把“a”替换为“b”)
删除一个字符(如把“traveling”变为“travelng”)
比如对于“abcdefg”和“abcdef”两个字符串来说,我们认为可以通过增加/减少一个“g”的方式来达到目的。无论增加还是减少“g”,我们都仅仅需要一次操作。我们把这个操作所需要的次数定义为两个字符串的距离。
给定任意两个字符串,写出一个算法来计算出他们的距离。
输入
第一行有一个整数n。表示测试数据的组数,
接下来共n行,每行两个字符串,用空格隔开。表示要计算距离的两个字符串
字符串长度不超过1000。
输出
针对每一组测试数据输出一个整数,值为两个字符串的距离。
样例输入
3
abcdefg abcdef
ab ab
mnklj jlknm
样例输出
1
0
4
思路
a串上一个指针i从头滑倒尾,b串上一个指针j从头滑倒尾;
dp[i][j]表示a串的前i+1个字符组成的子串与b串的前j+1个字符组成的子串的“距离”——要操作多少次使其相同。
每次移动一个i/j指针更新dp值时,只需关注a[i]与b[j]是否相同,对于它们有些仅有三种操作:两个成对,都删掉不用看了(要么相同,不增加距离,要么不同,进行修改,距离加一);删掉a[i];删掉b[j]。
从而有状态转移方程
dp[i][j]=min(dp[i-1][j-1]+1,dp[i][j-1]+1,dp[i-1][j]+1)【a[i]!=b[j]】
or min(dp[i-1][j-1],dp[i][j-1]+1,dp[i-1][j]+1)【a[i]==b[j]】
可以看出第二项简化为dp[i-1][j-1] (因为dp[i-1][j-1]<=dp[i][j-1]<dp[i][j-1]+1)
而边界情况是i=0 or j=0,对另一子串进行完全删除操作
注意
dp[i][j]中i,j的取值范围
#include<iostream>
#include<cstring>
using namespace std;
const int Max=1005;
int dp[Max][Max];// a串的前i个和b串的前j个(i=0,1,2……lena)
int main(){
int n;
cin>>n;
while(n--){
string a,b;
cin>>a>>b;
int lena = a.size(),lenb = b.size();
for(int i=0;i<=lena;++i)
for(int j=0;j<=lenb;++j)
{
if(i==0)
dp[i][j]=j;
else if(j==0)
dp[i][j]=i;
else if(a[i-1]==b[j-1])
dp[i][j]=dp[i-1][j-1];
else dp[i][j]=min(dp[i-1][j-1]+1,min(dp[i-1][j]+1,dp[i][j-1]+1));
}
cout<<dp[lena][lenb]<<endl;
}
return 0;
}