给出两个长度分别为n和m的字符串A和B,确定A和B中最长公共子序列的长度。
朴素算法:列举A中所有的子序列2n个,并逐个判断其是否在B中(Θ(m)耗费)。时间复杂度为Θ(m2n)。
利用动态规划可以在Θ(nm)的时间和Θ(min{m,n})的空间内解决最长公共子序列问题。
基本思路:
对于字符串A=a1a2...an,B=b1b2...bm,令L[i,j]表示a1a2...ai和b1b2...bj的最长公共子序列的长度。
初始条件:如果i=0或j=0,L[i,j]=0。
状态转移:
我们可以得出下面的结论:
伪代码:
C++代码:
#include<iostream>
#include<cstring>
#include<string>
#include<algorithm>
using namespace std;
int dp[1010][1010];
int main()
{
string a, b;
while (cin >> a >> b)
{
memset(dp, 0, sizeof(dp));
int lena = a.length();
int lenb = b.length();
for (int i = 0; i < lena; i++)
for (int j = 0; j < lenb; j++)
{
if (a[i] == b[j]) dp[i + 1][j + 1] = dp[i][j] + 1;
else dp[i + 1][j + 1] = max(dp[i][j + 1], dp[i + 1][j]);
}
cout << dp[lena][lenb] << endl;
}
}
C++代码(打印路径):
#include<stdio.h>
#include<string.h>
#include<algorithm>
using namespace std;
#define N 10
int dp[N][N];
int path[N];
int main()
{
char a[N];
char b[N];
freopen("lcsInput.txt","r",stdin);
freopen("lcsOutput.txt","w",stdout);
scanf("%s%s",a,b);
int la=strlen(a);
int lb=strlen(b);
memset(dp,0,sizeof(dp));
for(int i=1;i<=la;i++)
{
for(int j=1;j<=lb;j++)
{
if(a[i-1]==b[j-1])
dp[i][j]=dp[i-1][j-1]+1;
else
dp[i][j]=max(dp[i-1][j],dp[i][j-1]);
}
}
int i=la,j=lb,k=0;
while(dp[i][j])
{
if(dp[i][j]==dp[i-1][j])
i--;
else if(dp[i][j]==dp[i][j-1])
j--;
else
{
path[k++]=i-1;
i--;j--;
}
}
printf("%s\n%s\n",a,b);
printf("最长公共子序列长度=%d\n",dp[la][lb]);
for(int i=k-1;i>=0;i--)
printf("%c",a[path[i]]);
printf("\n");
return 0;
}
算法分析:
算法的过程就是不断填充一个n*m的表格,时间复杂度就是表格的大小Θ(nm),空间也可以控制在Θ(min{n,m})内。