字符串编辑距离 经典 dp

可以参考这个博客:点击打开链接

比较两个字符串相似度,可以通过最长公共子串,或者最长公共子序列,还有就是编辑距离。两个字符串通过插入,删除或者修改,来达到一致,编辑距离越短,可知相似度越高。

#include <bits/stdc++.h>
using namespace std ;
#define Min( a , b , c ) ( a < b ? ( a < c ? a : c ) : ( b < c ? b : c ) )
int dp[1010][1010] ;
char s1[1010] , s2[1010] ;

int main(){
	int n , m , i , j , cost ;
	while( ~scanf("%s%s" , s1 , s2 ) ){
		n = (int)strlen( s1 ) ;
		m = (int)strlen( s2 ) ;
		for( i = 0 ; i <= n ; ++i ) dp[i][0] = i ;  // 另一个字符串长度为 0 时,长度就是本字符串当前长度
		for( i = 0 ; i <= m ; ++i ) dp[0][i] = i ;
		for( i = 1 ; i <= n ; ++i )
			for( j = 1 ; j <= m ; ++j ){
				cost = s1[i-1] == s2[j-1] ? 0 : 1 ;     // 当前字符相等,可以选择修改 + cost
				dp[i][j] = Min( dp[i-1][j]+1 , dp[i][j-1]+1 , dp[i-1][j-1]+cost ) ;
			}    
		cout << dp[n][m] << endl ;
	}
	return 0 ;
}
因为当前字符串肯定是根据长度 -1 的字符串演变而来,从上面的 dp 也可以看出,i 只和 i-1 有关,所以为了节省空间,可以采用滚动数组。时间复杂度不变,但是空间复杂度从 O(n*m) 降到O( 2*max( n , m )  ) 。
#include <bits/stdc++.h>
using namespace std ;
#define Min( a , b , c ) ( a < b ? ( a < c ? a : c ) : ( b < c ? b : c ) )
int dp[2][1010] ;
char s1[1010] , s2[1010] ;

int main(){
	int n , m , i , j , cost ;
	while( ~scanf("%s%s" , s1 , s2 ) ){
		n = (int)strlen( s1 ) ;
		m = (int)strlen( s2 ) ;
		memset( dp , 0 , sizeof( dp ) ) ;
		for( i = 0 ; i <= m ; ++i ) 
			dp[0][i] = i ;
		for( i = 1 ; i <= n ; ++i ){
			dp[i&1][0] = i ;
			for( j = 1 ; j <= m ; ++j ){
				cost = s1[i-1] == s2[j-1] ? 0 : 1 ;
				dp[i&1][j] = Min( dp[(i-1)&1][j]+1 , dp[i&1][j-1]+1 , dp[(i-1)&1][j-1]+cost ) ;
			}
		}
		cout << dp[n&1][m] << endl ;
	}
	return 0 ;
}
上面的博客中还有一种空间复杂度 O( max( n , m ) ) 的解法, 利用了当前字符匹配相等,不需要做任何操作这一特点。
#include <bits/stdc++.h>
using namespace std ;
#define Min( a , b , c ) ( a < b ? ( a < c ? a : c ) : ( b < c ? b : c ) )
int dp[1010] ;
char s1[1010] , s2[1010] ;

int main(){
	int n , m , i , j , temp , cur ;
	while( ~scanf("%s%s" , s1 , s2 ) ){
		cout << "s1 = " << s1 << "\ts2 = " << s2 << endl ;
		n = (int)strlen( s1 ) ;
		m = (int)strlen( s2 ) ;
		for( i = 0 ; i <= m ; ++i ) 
			dp[i] = i ;
		for( i = 1 ; i <= n ; ++i ){
			cur = i-1 ;             // 因为另一个字符串长度不为 0 , 初始编辑距离-1,对应二维的 dp[i-1]
			for( j = 1 ; j <= m ; ++j ){
				temp = dp[j] ;              
				dp[j] = s1[i-1] == s2[j-1] ? cur : 1 + Min( dp[j-1] , dp[j] , cur ) ;
				cur = temp ;          // 保存下次的 dp[i-1][j-1] ;       
			}
		}
		cout << dp[m] << endl ;
	}
	return 0 ;
}



  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值