字符串编辑距离

来自编程之美:给定任意两个字符串,计算它们的编辑距离。

不难看出,两个字符串的距离肯定不超过它们的长度之和(我们可以通过删除操作把两个串都转化为空)。这个结论对结果没有帮助,但至少可以知道,任意两个字符串的距离都是有限的。

考虑如何才能把这个问题转化成规模较小的同样的问题。如果有两个字符串A=xabcdef和B=xfdfd,它们的第一个字符是相同的,只要计算A[2,...,7]=abcdef和B[2,...5] =fdfd的距离就可以了。但如果两个字符串的第一个字符不相同,那么可以进行如下操作(lenA和lenB分别是A和B的长度):

1. 删除A的第一个字符,然后计算A[2,...,lenA]和B[1,...,lenB]的距离。

2. 删除B的第一个字符,然后计算A[1,...,lenA]和B[2,...,lenB]的距离。

3. 修改A的第一个字符为B的第一个字符,然后计算A[2,...,lenA]和B[2,...,lenB]的距离。

4. 修改B的第一个字符为A的第一个字符,然后计算A[2,...,lenA]和B[2,...,lenB]的距离。

5. 增加A的第一个字符到B的前面,然后计算A[2,...,lenA]和B[1,...,lenB]的距离。

6. 增加B的第一个字符到A的前面,然后计算A[1,...,lenA]和B[2,...,lenB]的距离。

由于本题中,我们不在乎两个字符串变得相等后的字符串是怎样的,所以上面6步可以合并为:

1. 一步操作后,在将A[1,...,lenA]和B[2,...,lenB]变为相等的字符串。

2. 一步操作后,在将A[2,...,lenA]和B[1,...,lenB]变为相等的字符串。

3. 一步操作后,在将A[2,...,lenA]和B[2,...,lenB]变为相等的字符串。

于是,可以得到递归的代码:

 int stringDistance(string str1, int p1begin, int p1end, string str2, int p2begin, int p2end)
 {
	if (p1begin > p1end)
	{
		if (p2begin > p2end)
			return 0;
		else
			return p2end - p2begin + 1;
	}
	if (p2begin > p2end)
	{
		if (p1begin > p1end)
			return 0;
		else
			return p1end - p1begin + 1;
	}
	
	if (str1[p1begin] == str2[p2begin])
	{
		return stringDistance(str1, p1begin + 1, p1end, str2, p2begin + 1, p2end);
	}
	else
	{
		int t1 = stringDistance(str1, p1begin + 1, p1end, str2, p2begin + 2, p2end);
		int t2 = stringDistance(str1, p1begin + 2, p1end, str2, p2begin + 1, p2end);
		int t3 = stringDistance(str1, p1begin + 2, p1end, str2, p2begin + 2, p2end);
		return minValue(t1, t2, t3) + 1;
	}
 }



  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值