最长公共子序列
关于公共子序列的描述:
若给定序列X={x1,x2,…,xm},则另一序列Z={z1,z2,…,zk},是X的子序列是指存在一个严格递增下标序列{i1,i2,…,ik}使得对于所有j=1,2,…,k有:zj=xij。
例如,序列Z={B,C,D,B}是序列X={A,B,C,B,D,A,B}的子序列,相应的递增下标序列为{2,3,5,7}。
给定2个序列X和Y,当另一序列Z既是X的子序列又是Y的子序列时,称Z是序列X和Y的公共子序列。
公共子序列举例:
如下两个序列
X={A,B,C,B,D,A,B}
Y={B,D,C,A,B,A}
公共子序列可以是:
X={A,B,C,B,D,A,B}
Y={B,D,C,A,B,A}
3
问题:
给定2个序列X={x1,x2,…,xm}和Y={y1,y2,…,yn},找出X和Y的最长公共子序列。
分析:
设序列X={x1,x2,…,xm}和Y={y1,y2,…,yn}的最长公共子序列为Z={z1,z2,…,zk} ,则
- 若xm=yn,则集合Z的特点:
zk=xm=yn,且Zk-1是Xm-1和Yn-1的最长公共子序列。
公共子序列可以是:
X={A,B,C,B,A,D,A}
Y={B,D,C,A,B,A}
4 - 若xm≠yn且,则Z的特点:
是Xm-1和Y的最长公共子序列。
X和Yn-1的最长公共子序列。
公共子序列可以是:
X={A,B,C,B,D,A,B}
Y={B,D,C,A,B,A}
4
最优子结构证明:
设序列X={x1,x2,…,xm}和Y={y1,y2,…,yn}的最长公共子序列为Z={z1,z2,…,zk}
1、若xm=yn,则zk=xm=yn,则Zk-1是Xm-1和Yn-1的最长公共子序列。
设序列Xm-1={x1,x2,…,xm-1}和Yn-1={y1,y2,…,yn-1}的最长公共子序列为Zk-1={z1,z2,…,zk-1} ,
如果zk!= xm,则X和Y的公共子序列中包含以下符号 {z1,z2,…,zk-1,zk,xm} ,
即Xm和Yn最长公共子序列的长度为k+1,这与矛盾,
则必有zk== xm
如果Xm-1和Yn-1有一个长度大于k-1的公共子序列,
则将xm则加在其尾部,将产生一个长度大于k的公共子序列,这与已知矛盾。
因此,必有Zk-1是Xm-1和Yn-1的最长公共子序列
2、若xm≠yn且zk≠xm, 则Z是Xm-1和Y的最长公共子序列。
zk≠xm, 即xm不出现在公共子序列中,则Z是Xm-1和Y的最长公共子序列。
如果Xm-1和Y存在一个长度大于K的最长公共子序列W,则
W也是X和Y的公共子序列。
这与Z是X和Y的公共子序列矛盾。
3、若xm≠yn且zk≠yn, 则Z是X和Yn-1的最长公共子序列。
zk≠yn,即yn不出现在公共子序列当中,则z是xm和yn-1的最长公共子序列。
如果yn-1和x存在一个长度大于k的最长公共子序列w,则
w也是下和y的公共子序列。
这与Z是X和Y的公共子序列矛盾。
用c[i][j]记录序列的最长公共子序列的长度。
Xi={x1,x2,…,xi};Yj={y1,y2,…,yj}。
当i=0或j=0时,c[i][j]=?
故此时c[i][j]=0。
其它情况下:
x[i]==y[j], c[i][j]=?
c[i][j]=c[i-1][j-1]+1
x[i]!=y[j], c[i][j]=?
c[i][j]=max(c[i-1][j], c[i][j-1])
公共子序列可以是:
X={A,B,C,B,D,A,B}
Y={B,D,C,A,B,A}
4
//最大公共子序列
#include<iostream>
using namespace std;
#define NUM 100
int c[NUM][NUM]; //x[1-i] 和 y[1-j]之间的公共子序列的长度。
int b[NUM][NUM]; //辅助完成最优解计算
void LCSLength(int m, int n, const char x[], char y[])
{
int i, j;
//数组c的第0行、第0列置零
for (int i = 0; i < m; i++) //第0列
c[i][0] = 0;
for (int i = 0; i < m; i++) //第0行
c[0][i] = 0;
//根据递推公式构造数组c
for (int i = 1; i <= m; i++)
{
for (int j = 1; j <= m; j++)
if (x[i] == y[i])
{
c[i][j] = c[i - 1][j - 1] + 1;
b[i][j] = 1;
}
else if (c[i - 1][j] >= c[i][j - 1])
{
c[i][j] = c[i - 1][j];
b[i][j] = 2;
}
else
{
c[i][j] = c[i][j - 1];
b[i][j] = 3;
}
}
}
//构造最长公共子序列
void LCS(int i, int j, char x[]) //i代表x数组的数量,j代表y的数量
{
if (i == 0 || j == 0)
return;
else
if (b[i][j] == 1)
{
LCS(i - 1, j - 1, x);
cout << x[i];
}
else if (b[i][j] == 2)
LCS(i - 1, j, x);
else
LCS(i, j - 1, x);
}
int main()
{
//首个字符不进行测试,舍弃
char x[5] = { ' ','c','c','b','m' };
char y[8] = { ' ','c','m','b','m','b','v','m' };
LCSLength(5, 8, x, y);
LCS(5, 8, x);
}
运行结果如图: