计算字符串距离(动归)

计算字符串距离

描述
对于两个不同的字符串,我们有一套操作方法来把他们变得相同,具体方法为:
修改一个字符(如把“a”替换为“b”)
删除一个字符(如把“traveling”变为“travelng”)
比如对于“abcdefg”和“abcdef”两个字符串来说,我们认为可以通过增加/减少一个“g”的方式来达到目的。无论增加还是减少“g”,我们都仅仅需要一次操作。我们把这个操作所需要的次数定义为两个字符串的距离。
给定任意两个字符串,写出一个算法来计算出他们的距离。
输入
第一行有一个整数n。表示测试数据的组数,
接下来共n行,每行两个字符串,用空格隔开。表示要计算距离的两个字符串
字符串长度不超过1000。
输出
针对每一组测试数据输出一个整数,值为两个字符串的距离。
样例输入

3
abcdefg  abcdef
ab ab
mnklj jlknm

样例输出

1
0
4

思路
a串上一个指针i从头滑倒尾,b串上一个指针j从头滑倒尾;
dp[i][j]表示a串的前i+1个字符组成的子串与b串的前j+1个字符组成的子串的“距离”——要操作多少次使其相同。
每次移动一个i/j指针更新dp值时,只需关注a[i]与b[j]是否相同,对于它们有些仅有三种操作:两个成对,都删掉不用看了(要么相同,不增加距离,要么不同,进行修改,距离加一);删掉a[i];删掉b[j]。
从而有状态转移方程
dp[i][j]=min(dp[i-1][j-1]+1,dp[i][j-1]+1,dp[i-1][j]+1)【a[i]!=b[j]】
or min(dp[i-1][j-1],dp[i][j-1]+1,dp[i-1][j]+1)【a[i]==b[j]】
可以看出第二项简化为dp[i-1][j-1] (因为dp[i-1][j-1]<=dp[i][j-1]<dp[i][j-1]+1)
而边界情况是i=0 or j=0,对另一子串进行完全删除操作
注意
dp[i][j]中i,j的取值范围

#include<iostream>
#include<cstring>
using namespace std;
const int Max=1005;
int dp[Max][Max];// a串的前i个和b串的前j个(i=0,1,2……lena) 

int main(){
	int n;
	cin>>n;
	while(n--){
		string a,b;
		cin>>a>>b;
		int lena = a.size(),lenb = b.size();
		for(int i=0;i<=lena;++i)
			for(int j=0;j<=lenb;++j)
			{
				if(i==0)
					dp[i][j]=j;
				else if(j==0)
					dp[i][j]=i;
				else if(a[i-1]==b[j-1])
					dp[i][j]=dp[i-1][j-1];
				else dp[i][j]=min(dp[i-1][j-1]+1,min(dp[i-1][j]+1,dp[i][j-1]+1));
			}
		cout<<dp[lena][lenb]<<endl;
	}
	return 0;
} 
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
计算字符串距离通常指计算两个字符串之间的编辑距离,也称为Levenshtein距离。编辑距离指将一个字符串转换成另一个字符串所需的最少操作次数,可以通过插入、删除和替换字符三种操作来实现。 以下是一种常见的计算字符串距离的算法: 1. 初始化一个二维矩阵,矩阵的行数为第一个字符串的长度加一,列数为第二个字符串的长度加一。 2. 将第一行和第一列依次填充为从0到第一个字符串或第二个字符串的长度。 3. 遍历矩阵,对于矩阵中的每个位置(i, j),根据以下三种情况进行计算: - 如果第一个字符串在位置i-1处的字符等于第二个字符串在位置j-1处的字符,则该位置的值等于左上角的值。 - 如果不相等,则该位置的值等于左上角、左侧和上方三个位置中的最小值加一。 4. 最后矩阵的最右下角的值就是两个字符串之间的编辑距离。 以下是一个Python实现的例子: ``` def edit_distance(s1, s2): m, n = len(s1), len(s2) dp = [[0 for _ in range(n+1)] for _ in range(m+1)] for i in range(m+1): dp[i][0] = i for j in range(n+1): dp[0][j] = j for i in range(1, m+1): for j in range(1, n+1): if s1[i-1] == s2[j-1]: dp[i][j] = dp[i-1][j-1] else: dp[i][j] = min(dp[i-1][j], dp[i][j-1], dp[i-1][j-1]) + 1 return dp[m][n] ``` 该函数接受两个字符串作为输入,返回它们之间的编辑距离。例如,`edit_distance('kitten', 'sitting')`的结果为3。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值