1、LCS的基本概念
子序列:一个序列X任意删除若干个字符得到新序列Z,则Z叫做X的子序列。例如Z=<B,C,D,B>是X=<A,B,C,B,D,A,B>的子序列,相当于删除A、B、A。
公共子序列:给定两个序列X和Y,如果Z既是X的子序列,也是Y的子序列,我们称它为X和Y的公共子序列。公共子序列可能不唯一。例如<B,C,A>是X=<A,B,C,B,D,A,B>和Y=<B,D,C,A,B,A>的一个公共子序列。
最长公共子序列:Longest Common Subsequence,简称LCS。如果Z是X和Y的公共子序列,且是最长的那个,则称Z是X和Y的最长公共子序列。例如<B,C,B,A>是X=<A,B,C,B,D,A,B>和Y=<B,D,C,A,B,A>的一个最长公共子序列,<B,D,A,B>也是。它也可能不唯一。
注:(1)为了简便,上面我们讨论的都是两个序列的公共子序列,当然,也可以是3个、4个等等。(2)它和最长公共子串是有区别的,最长公共子串要求连续。
解决这个问题要理智解决,暴力求解绝对不可取,接下来的正解很容易理解,fighting!
2.LCS的最优子结构
在这里先说些前缀的概念,给定一个序列X=<x1,x2,…,xm>,对i=0,1,…,m,定义X的第i前缀为Xi=<x1,x2,…,xi>。例如,若X=<A,B,C,B,D,A,B>,则X4=<A,B,C,B>,X0为空串。
令X=<x1,x2,…,xm>和Y=<y1,y2,…,yn>为两个序列,Z=<z1,z2,…,zk>为X和Y的任意LCS。
1)如果xm=yn,则zk=xm=yn且Zk-1是Xm-1和Yn-1的一个LCS。也就是
例如:
2)如果xm≠yn,那么zk≠xm意味着Z是xm-1和Y的一个LCS。
也就是,LCS(Xm,Yn)=LCS(Xm-1,Yn)。
3)如果xm≠yn,那么zk≠yn意味着Z是X和Yn-1的一个LCS。也就是,LCS(Xm,Yn)=LCS(Xm,Yn-1)。
例如:
3.LCS的分析总结
显然,是动态规划问题。
4.具体问题分析
http://www.51nod.com/Challenge/Problem.html#!#problemId=1006这道题要求得到具体的最长公共子序列
思路就是 做完dp后,倒推输出
#include<cstring>
#include<cstdio>
#include<cmath>
#include<iostream>
#include<algorithm>
using namespace std;
char a[1010],b[1010];//a,b是两个字符串
int f[1010][1010];//f记录两个字符串中相同字母的长度
string s;
int main()
{
scanf("%s",a+1);
scanf("%s",b+1);
int n=strlen(a+1);
int m=strlen(b+1);
for(int i=1;i<=n;i++)
for(int j=1;j<=m;j++)
{
if(a[i]==b[j]) f[i][j]=f[i-1][j-1]+1;
else f[i][j]=max(f[i-1][j],f[i][j-1]);
}
int i=n,j=m;
while(i && j)
{
if(a[i]==b[j])
{
s+=a[i];
i--;
j--;
}
else if(f[i][j]==f[i-1][j]) i--;
else j--;
}
int len=s.length();
//cout<<len<<endl;//输出最长公共子序列的长度
for(int i=len-1;i>=0;i--)
printf("%c",s[i]);
}
但是!!!在上面的代码中,最后注释掉的一行代码可以求最长公共子序列的长度