给定两个字符串 text1 和 text2,返回这两个字符串的最长 公共子序列 的长度。如果不存在 公共子序列 ,返回 0 。
一个字符串的 子序列 是指这样一个新的字符串:它是由原字符串在不改变字符的相对顺序的情况下删除某些字符(也可以不删除任何字符)后组成的新字符串。
例如,"ace" 是 "abcde" 的子序列,但 "aec" 不是 "abcde" 的子序列。
两个字符串的 公共子序列 是这两个字符串所共同拥有的子序列。
二维动态规划问题。
假设字符串 text 1和text 2的长度分别为 m和 n,创建 m+1行 n+1列的二维数组 dp,其中 dp[i][j] 表示 text1[0:i] 和text2[0:j] 的最长公共子序列的长度。
说明:text1[0:i] 表示text1的长度为 i的前缀,text2[0:j] 表示text 2的长度为 jj 的前缀。
边界情况:
当 i=0 时,text1[0:i] 为空,空字符串和任何字符串的最长公共子序列的长度都是 0,因此对任意0≤j≤n,有 dp[0][j]=0;
当 j=0时,text2[0:j] 为空,同理可得,对任意0≤i≤m,有dp[i][0]=0。
因此动态规划的边界情况是:当 i=0或 j=0时dp[i][j]=0。
当 i>0i>0 且 j>0j>0 时,考虑dp[i][j] 的计算:
当text1[i−1]=text2[j−1] 时,将这两个相同的字符称为公共字符,考虑text1[0:i−1] 和text 2
[0:j−1] 的最长公共子序列,再增加一个字符(即公共字符)即可得到text1[0:i] 和text2
[0:j] 的最长公共子序列,因此dp[i][j]=dp[i-1][j-1]+1。
当text 1[i−1] !=text 2[j−1] 时,考虑以下两项:
text1[0:i−1] 和text2[0:j] 的最长公共子序列;
text1[0:i] 和text2[0:j−1] 的最长公共子序列。
要得到text1[0:i] 和text2[0:j] 的最长公共子序列,应取两项中的长度较大的一项,因此dp[i][j]=max(dp[i−1][j],dp[i][j−1])。
由此可以得到如下状态转移方程:
C程序
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#define MAXSIZE 1000
int longest_substr(char *str1, char *str2)
{
int len1 = strlen(str1), len2 = strlen(str2);
int dp[len1 + 1][len2 + 1]; //定义一个dp数组
int i = 0, j =0;
for(i = 0; i < len1 + 1; ++i) {
for(j = 0; j < len2 + 1; ++j) {
dp[i][j] = 0;
}
}
for(i = 0; i < len1 + 1; ++i){
for(j = 0; j < len2 + 1; ++j){
if(str1[i - 1] == str2[j - 1])
dp[i][j] = dp[i - 1][j - 1] + 1;
else if(dp[i - 1][j] > dp[i][j - 1])
dp[i][j] = dp[i - 1][j];
else
dp[i][j] = dp[i][j - 1];
}
}
return dp[i - 1][j - 1];
}
int main()
{
char str1[MAXSIZE], str2[MAXSIZE];
scanf("%s %s", str1, str2);
printf("%d", longest_substr(str1, str2));
}