问题描述
若给定序列X={x1,x2,…,xm},则另一序列Z={z1,z2,…,zk},是X的子序列是指存在一个严格递增下标序列{i1,i2,…,ik}使得对于所有j=1,2,…,k有:zj=xij。
例如,序列Z={B,C,D,B}是序列X={A,B,C,B,D,A,B}的子序列,相应的递增下标序列为{2,3,5,7}。
给定2个序列X和Y,当另一序列Z既是X的子序列又是Y的子序列时,称Z是序列X和Y的公共子序列。
给定2个序列X={x1,x2,…,xm}和Y={y1,y2,…,yn},找出X和Y的最长公共子序列。
分析最长公共子序列的结构
设序列X={x1,x2,…,xm}和Y={y1,y2,…,yn}的最长公共子序列为Z={z1,z2,…,zk} ,则
若xm=yn,则zk=xm=yn,且zk-1是xm-1和yn-1的最长公共子序列。
若xm≠yn且zk≠xm,则Z是xm-1和Y的最长公共子序列。
若xm≠yn且zk≠yn,则Z是X和yn-1的最长公共子序列。
分析子问题的递归结构
由最长公共子序列问题的最优子结构性质可知,要找出X和Y的最长公共子序列,可按以下方式递归地进行:
当xm=yn时,找出Xm-1和Yn-1的最长公共子序列,然后在其尾部加上xm(=yn)即可得X和Y的一个最长公共子序列。
当xm≠yn时,必须解两个子问题,即找出Xm-1和Y的一个最长公共子序列及X和Yn-1的一个最长公共子序列。这两个公共子序列中较长者为X和Y的一个最长公共子序列。
设计备忘录
用c[i][j]记录序列和的最长公共子序列的长度。
Xi={x1,x2,…,xi};Yj={y1,y2,…,yj}。
当i=0或j=0时,空序列是Xi和Yj的最长公共子序列。故此时C[i][j]=0。
其它情况下,由最优子结构性质可建立递归关系如下:
设计追踪解辅助数组
b[i][j]=1,表示Xi=Yj的情况
b[i][j]=2,表示Xi≠Yj且c[i][j]=c[i-1][j]的情况
b[i][j]=3,表示Xi≠Yj且c[i][j]=c[i][j-1]的情况
代码实现
#define NUM 100
int c[NUM][NUM];
int b[NUM][NUM];
void LCSLength (int m, int n, const char x[],char y[])
{
int i,j;
//数组c的第0行、第0列置0
for (i = 1; i <= m; i++) c[i][0] = 0;
for (i = 1; i <= n; i++) c[0][i] = 0;
//根据递推公式构造数组c
for (i = 1; i <= m; i++)
for (j = 1; j <= n; j++)
{
if (x[i]==y[j])
{c[i][j]=c[i-1][j-1]+1; b[i][j]=1; } //↖
else if (c[i-1][j]>=c[i][j-1])
{c[i][j]=c[i-1][j]; b[i][j]=2; } //↑
else { c[i][j]=c[i][j-1]; b[i][j]=3; } //←
}
}
void LCS(int i,int j,char x[])
{
if (i ==0 || j==0) return;
if (b[i][j]== 1){ LCS(i-1,j-1,x); printf("%c",x[i]); }
else if (b[i][j]== 2) LCS(i-1,j,x);
else LCS(i,j-1,x);
}
性能分析
时间复杂度:O(mn)
空间复杂度:O(mn)