可以参考这个博客:点击打开链接
比较两个字符串相似度,可以通过最长公共子串,或者最长公共子序列,还有就是编辑距离。两个字符串通过插入,删除或者修改,来达到一致,编辑距离越短,可知相似度越高。
#include <bits/stdc++.h>
using namespace std ;
#define Min( a , b , c ) ( a < b ? ( a < c ? a : c ) : ( b < c ? b : c ) )
int dp[1010][1010] ;
char s1[1010] , s2[1010] ;
int main(){
int n , m , i , j , cost ;
while( ~scanf("%s%s" , s1 , s2 ) ){
n = (int)strlen( s1 ) ;
m = (int)strlen( s2 ) ;
for( i = 0 ; i <= n ; ++i ) dp[i][0] = i ; // 另一个字符串长度为 0 时,长度就是本字符串当前长度
for( i = 0 ; i <= m ; ++i ) dp[0][i] = i ;
for( i = 1 ; i <= n ; ++i )
for( j = 1 ; j <= m ; ++j ){
cost = s1[i-1] == s2[j-1] ? 0 : 1 ; // 当前字符相等,可以选择修改 + cost
dp[i][j] = Min( dp[i-1][j]+1 , dp[i][j-1]+1 , dp[i-1][j-1]+cost ) ;
}
cout << dp[n][m] << endl ;
}
return 0 ;
}
因为当前字符串肯定是根据长度 -1 的字符串演变而来,从上面的 dp 也可以看出,i 只和 i-1 有关,所以为了节省空间,可以采用滚动数组。时间复杂度不变,但是空间复杂度从 O(n*m) 降到O( 2*max( n , m ) ) 。
#include <bits/stdc++.h>
using namespace std ;
#define Min( a , b , c ) ( a < b ? ( a < c ? a : c ) : ( b < c ? b : c ) )
int dp[2][1010] ;
char s1[1010] , s2[1010] ;
int main(){
int n , m , i , j , cost ;
while( ~scanf("%s%s" , s1 , s2 ) ){
n = (int)strlen( s1 ) ;
m = (int)strlen( s2 ) ;
memset( dp , 0 , sizeof( dp ) ) ;
for( i = 0 ; i <= m ; ++i )
dp[0][i] = i ;
for( i = 1 ; i <= n ; ++i ){
dp[i&1][0] = i ;
for( j = 1 ; j <= m ; ++j ){
cost = s1[i-1] == s2[j-1] ? 0 : 1 ;
dp[i&1][j] = Min( dp[(i-1)&1][j]+1 , dp[i&1][j-1]+1 , dp[(i-1)&1][j-1]+cost ) ;
}
}
cout << dp[n&1][m] << endl ;
}
return 0 ;
}
上面的博客中还有一种空间复杂度 O( max( n , m ) ) 的解法, 利用了当前字符匹配相等,不需要做任何操作这一特点。
#include <bits/stdc++.h>
using namespace std ;
#define Min( a , b , c ) ( a < b ? ( a < c ? a : c ) : ( b < c ? b : c ) )
int dp[1010] ;
char s1[1010] , s2[1010] ;
int main(){
int n , m , i , j , temp , cur ;
while( ~scanf("%s%s" , s1 , s2 ) ){
cout << "s1 = " << s1 << "\ts2 = " << s2 << endl ;
n = (int)strlen( s1 ) ;
m = (int)strlen( s2 ) ;
for( i = 0 ; i <= m ; ++i )
dp[i] = i ;
for( i = 1 ; i <= n ; ++i ){
cur = i-1 ; // 因为另一个字符串长度不为 0 , 初始编辑距离-1,对应二维的 dp[i-1]
for( j = 1 ; j <= m ; ++j ){
temp = dp[j] ;
dp[j] = s1[i-1] == s2[j-1] ? cur : 1 + Min( dp[j-1] , dp[j] , cur ) ;
cur = temp ; // 保存下次的 dp[i-1][j-1] ;
}
}
cout << dp[m] << endl ;
}
return 0 ;
}