目录
一. 问题描述
已知两个字符串S1与S2,求这两个字符序列的最长公共子序列(不要求连续)。例如字符序列abcbdb和字符序列acbbabdbb的最长公共子序列为acbdb。
二. 题解及代码
字符串子序列的基本概念可以参考文章 子序列基本概念。问题分析如下:
(1)假如字符串S1的最后一个元素与字符串S2的最后一个元素相同。那么S1和S2的最长公共子序列LCS就等于 {S1减去最后一个元素} 与 {S2减去最后一个元素} 的 LCS 再加上 S1和S2相等的最后一个元素。
(2)假如S1的最后一个元素 与 S2的最后一个元素不同。那么S1和S2的LCS就等于 : {S1减去最后一个元素} 与 S2 的LCS, {S2减去最后一个元素} 与 S1 的LCS 中的最长的那个序列。
综上所述,其递推公式如下,其中 i,j 分别是指字符串 S1,S2 中前 i,j 个字符的字串序列:
从另一种角度看,要解决LCS问题,需要把原问题分解成若干个子问题,所以需要刻画LCS的特征。设A=“a0,a1,…,am”,B=“b0,b1,…,bn”,且Z=“z0,z1,…,zk”为它们的最长公共子序列。不难证明有以下性质:
- 如果am=bn,则zk=am=bn,且“z0,z1,…,z(k-1)”是“a0,a1,…,a(m-1)”和“b0,b1,…,b(n-1)”的一个最长公共子序列;
- 如果am!=bn,则若zk!=am,蕴涵“z0,z1,…,zk”是“a0,a1,…,a(m-1)”和“b0,b1,…,bn”的一个最长公共子序列;
- 如果am!=bn,则若zk!=bn,蕴涵“z0,z1,…,zk”是“a0,a1,…,am”和“b0,b1,…,b(n-1)”的一个最长公共子序列。
#include <stdio.h>
#include<string.h>
char a[1000],b[1000];//输入两个字符串
int digit[1000][1000];//记录a到i同时b到j的最大长度
int output[1000][1000];//用于输出标记
char put[1000];//保存输出字符
int main()
{
int n,m;
while(scanf("%d%d",&n,&m)!=EOF)
{
getchar();
memset(a,0,sizeof(a));
memset(b,0,sizeof(b));
memset(digit,0,sizeof(digit));
memset(put,0,sizeof(put));
gets(a);
gets(b);
int i,j;
for(i=0; i<n; i++)
{
for(j=0; j<m; j++)
{
if(a[i]==b[j])
{
digit[i+1][j+1]=digit[i][j]+1;//长度加一
output[i+1][j+1]=1;//此处标记为1
}
else if(digit[i+1][j]>=digit[i][j+1])//不然选子序列较大的那个
{
digit[i+1][j+1]=digit[i+1][j];
output[i+1][j+1]=2;//删掉b结尾较大,此处标记为2
}
else
{
digit[i+1][j+1]=digit[i][j+1];//删掉a结尾较大,此处标记为3
output[i+1][j+1]=3;
}
}
}
printf("最长公共子序列长度为: %d\n",digit[n][m]);
// 输出序列
i=n,j=m;
int k=digit[n][m];
while(i>0&&j>0)
{
if(output[i][j]==1)//==1时为两子序列公共地方,存下来
{
put[k-1]=a[i-1];
i--;
j--;
k--;
}
else if(output[i][j]==2)//标记为2时是删掉b结尾导致的,顺着往上应该j--,下面同理
j--;
else
i--;
}
printf("最长公共子序列为: %s\n",put);
}
return 0;
}