最长公共子序列
给定一个序列
X
=
<
x
1
,
x
2
,
x
3
,
x
4
.
.
.
,
x
m
>
X=<x_1,x_2,x_3,x_4...,x_m>
X=<x1,x2,x3,x4...,xm>,另一个序列
Z
=
<
z
1
,
z
2
,
z
3
,
z
4
.
.
.
,
z
k
>
Z=<z_1,z_2,z_3,z_4...,z_k>
Z=<z1,z2,z3,z4...,zk>,若存在一个严格递增的
X
X
X的下标序列
<
i
1
,
i
2
,
i
3
,
.
.
.
,
i
k
>
<i_1,i_2,i_3,...,i_k>
<i1,i2,i3,...,ik>对所有的
1
,
2
,
3
,
.
.
.
,
k
1,2,3,...,k
1,2,3,...,k,都满足
x
i
k
=
z
k
x_{i_k}=z_k
xik=zk,则称
Z
Z
Z是
X
X
X的子序列
注意这个子序列并不是一定要连续的,只是要相对位置不变
比如 Z = < B , C , D , B > Z=<B,C,D,B> Z=<B,C,D,B>是 X = < A , X=<A, X=<A, B \large{B} B, C \large{C} C , B , ,B, ,B, D \large{D} D , A , ,A, ,A, B \large{B} B > > >的子序列
公共子序列定义:
如果
Z
Z
Z既是
X
X
X的子序列,又是
Y
Y
Y的子序列,则称
Z
Z
Z为
X
X
X和
Y
Y
Y的公共子序列
最长公共子序列(以下简称LCS):
2个序列的子序列中长度最长的那个
定理
设 X = < x 1 , x 2 , x 3 , x 4 . . . , x m > , Y = < y 1 , y 2 , y 3 , y 4 . . . , y n > X=<x_1,x_2,x_3,x_4...,x_m>,Y=<y_1,y_2,y_3,y_4...,y_n> X=<x1,x2,x3,x4...,xm>,Y=<y1,y2,y3,y4...,yn>为两个序列, Z = < z 1 , z 2 , z 3 , z 4 . . . , z k > Z=<z_1,z_2,z_3,z_4...,z_k> Z=<z1,z2,z3,z4...,zk>是他们的任意 L C S LCS LCS。
- 如果 x m = y n x_m = y_n xm=yn,则 z k = x m = y n z_k = x_m = y_n zk=xm=yn 且 Z k − 1 Z_{k-1} Zk−1是 X m − 1 X_{m-1} Xm−1和 Y n − 1 Y_{n-1} Yn−1的一个 L C S LCS LCS
- 如果 x m ≠ y n x_m ≠ y_n xm=yn 且 z k ≠ x m z_k ≠ x_m zk=xm,则 Z Z Z是 X m − 1 X_{m-1} Xm−1和 Y Y Y的一个 L C S LCS LCS
- 如果 x m ≠ y n x_m ≠y_n xm=yn 且 z k ≠ y n z_k ≠ y_n zk=yn,则 Z Z Z是 X X X和 Y n − 1 Y_{n-1} Yn−1的一个 L C S LCS LCS
递推式
伪代码
一个例子
代码实现
#include <iostream>
#include <string>
#include <stack>
using namespace std;
void LCS(string s1,string s2)
{
int m=s1.length()+1;
int n=s2.length()+1;
int **c;
int **b;
c=new int* [m];
b=new int* [m];
for(int i=0;i<m;i++)
{
c[i]=new int [n];
b[i]=new int [n];
for(int j=0;j<n;j++)
b[i][j]=0;
}
for(int i=0;i<m;i++)
c[i][0]=0;
for(int i=0;i<n;i++)
c[0][i]=0;
for(int i=0;i<m-1;i++)
{
for(int j=0;j<n-1;j++)
{
if(s1[i]==s2[j])
{
c[i+1][j+1]=c[i][j]+1;
b[i+1][j+1]=1; //1表示箭头为 左上
}
else if(c[i][j+1]>=c[i+1][j])
{
c[i+1][j+1]=c[i][j+1];
b[i+1][j+1]=2; //2表示箭头向 上
}
else
{
c[i+1][j+1]=c[i+1][j];
b[i+1][j+1]=3; //3表示箭头向 左
}
}
}
for(int i=0;i<m;i++) //输出c数组
{
for(int j=0;j<n;j++)
{
cout<<c[i][j]<<' ';
}
cout<<endl;
}
stack<char> same; //存LCS字符
stack<int> same1,same2; //存LCS字符在字符串1和字符串2中对应的下标,方便显示出来
for(int i = m-1,j = n-1;i >= 0 && j >= 0; )
{
if(b[i][j] == 1)
{
i--;
j--;
same.push(s1[i]);
same1.push(i);
same2.push(j);
}
else if(b[i][j] == 2)
i--;
else
j--;
}
cout<<s1<<endl; //输出字符串1
for(int i=0;i<m && !same1.empty();i++) //输出字符串1的标记
{
if(i==same1.top())
{
cout<<1;
same1.pop();
}
else
cout<<' ';
}
cout<<endl<<s2<<endl; //输出字符串2
for(int i=0;i<n && !same2.empty();i++) //输出字符串2的标记
{
if(i==same2.top())
{
cout<<1;
same2.pop();
}
else
cout<<' ';
}
cout<<endl<<"最长公共子序列为:";
while(!same.empty())
{
cout<<same.top();
same.pop();
}
cout<<endl<<"长度为:"<<c[m-1][n-1]<<endl;
for (int i = 0; i<m; i++)
{
delete [] c[i];
delete [] b[i];
}
delete []c;
delete []b;
}
int main()
{
string s1="ABCPDSFJGODIHJOFDIUSHGD";
string s2="OSDIHGKODGHBLKSJBHKAGHI";
LCS(s1,s2);
return 0;
}