编辑距离问题(动态规划)

问题描述:设A和B是两个字符串,要用最少的字符操作将字符串A转换为字符串B,这里所说的字符操作包括(1):删除一个字符;(2):插入一个字符;(3):修改一个字符。将A转换为B所用的最少字符操作数称为A到B的编辑距离,记为d[A][B],d[][]中的A,B指的是A和B的长度,设计一个算法对任给的A,B,计算出d[A][B]。

问题举例:假设A = "fxpimu", B = "xwrs",则d[6][4]为5。

问题分析:这个问题乍一看好像没什么突破口,这样,我们回忆一下01台阶问题,到达第i个台阶的办法只有两种办法,一个是跨一步到,一个是跨两步到,将这样的分析思路带入到这道题中,计算出d[A][B]的途径有哪几种,其实就是题目已经告诉的三种:删除,插入,修改字符,我们一一来看:删除其实是d[i-1][j]+1(i-1转换为j-1的编辑距离再加1,这个1是删除的操作),同理插入可表示为d[i][j-1]+1那修改如何表示呢?我们想象在进行字符操作后(计算d[][]的过程中),i-1和j-1已经完全相等,那么各给它们两个后再添加一个字符,那么修改就取决于添加的两个字符相不相等,如果相等d[i][j] = d[i-1][j-1],如果不相等d[i][j] = d[i-1][j-1]+1(就修改一次)。所以经过分析可以得到递推表达式:

递推公式知道后就是代码了:

#include <stdio.h>

int d[100][100] ;

int min(int a, int b)
{
	if(a > b){
		return b ;
	}
	else 
		return a ;
}

int lenth(char A[])
{
	int len = 0, i ;
	for(i=0; A[i]!='\0'; i++){
		len++ ;
	}
	return len ;
}

void calculate(char A[], char B[])
{
	int i, j ;

	for(i=0; i<=lenth(A); i++) d[i][0] = i ;
	for(j=0; j<=lenth(B); j++) d[0][j] = j ;

	for(i=1; i<=lenth(A); i++){
		for(j=1; j<=lenth(B); j++){
			
			if(A[i] == B[j]){
				d[i][j] = d[i-1][j-1] ;
			}
			else {
				d[i][j] = d[i-1][j-1] + 1 ;
			}
			printf("d[i-1][j]+1 = %d, d[i][j-1]+1 = %d, d[i][j] = %d\n", d[i-1][j]+1, d[i][j-1]+1, d[i][j]) ;
			d[i][j] = min( d[i][j], min( d[i-1][j]+1, d[i][j-1]+1 ) ) ;
			printf("%d\n", d[i][j]) ;
		}
	}
}

int main()
{
	char A[100], B[100] ;

	printf("请输入第一个字符串:") ;
	scanf("%s", A) ;
	printf("请输入第二个字符串:") ;
	scanf("%s", B) ;

	calculate(A, B) ;

	printf("编辑最短距离:%d\n", d[lenth(A)][lenth(B)]) ;

	return 0 ;
}

 

  • 25
    点赞
  • 97
    收藏
    觉得还不错? 一键收藏
  • 8
    评论
编辑距离问题是一个经典的动态规划问题,用于衡量两个字符串之间的相似度。它可以通过一系列的插入、删除和替换操作将一个字符串转换为另一个字符串动态规划是解决编辑距离问题的常用方法。 下面是使用动态规划解决编辑距离问题的步骤: 1. 创建一个二维数组dp,其中dp[i][j]表示将字符串A的前i个字符转换为字符串B的前j个字符所需的最小操作数。 2. 初始化dp数组的第一行和第一列,分别表示将空字符串转换为A和B所需的操作数。 3. 遍历dp数组,计算dp[i][j]的值: - 如果A的第i个字符等于B的第j个字符,则dp[i][j]等于dp[i-1][j-1],因为不需要进行任何操作。 - 否则,dp[i][j]等于dp[i-1][j-1] + 1,表示将A的第i个字符替换为B的第j个字符。 - 另外,还需要考虑插入和删除操作。dp[i][j]等于dp[i][j-1] + 1,表示在A的第i个字符后插入B的第j个字符;dp[i][j]等于dp[i-1][j] + 1,表示删除A的第i个字符。 - 最后,取这三种操作中的最小值作为dp[i][j]的值。 4. 最终,dp[m][n]即为将字符串A转换为字符串B所需的最小操作数,其中m和n分别为A和B的长度。 下面是一个使用动态规划求解编辑距离的Python代码示例: ```python def minDistance(word1, word2): m, n = len(word1), len(word2) dp = [[0] * (n + 1) for _ in range(m + 1)] for i in range(m + 1): dp[i][0] = i for j in range(n + 1): dp[0][j] = j for i in range(1, m + 1): for j in range(1, n + 1): if word1[i - 1] == word2[j - 1]: dp[i][j] = dp[i - 1][j - 1] else: dp[i][j] = min(dp[i - 1][j - 1], dp[i][j - 1], dp[i - 1][j]) + 1 return dp[m][n] word1 = "horse" word2 = "ros" print("编辑距离为:", minDistance(word1, word2)) # 输出:3 ```
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值