最长公共子序列的定义:
设序列 X = <x1, x2, ... , xm >,Z = <z1, z2, ... , zk > 若存在 一个严格递增下标序列{i_1,i_2,…,i_k}使得 z_j=x_i_j,j=1,…,k 则称 Z 是 X 的子序列,子序列所包含的元素个数称为子序列的长度。 如果Z 既是 X的子序列又是 Y的子序列,则称Z为X 与 Y 的公共子序列 。
例:
X: A B C B D A B
Y: B D C A B A
公共子序列: B C A
最长公共子序列: B C B A 或 B D A B
LCS并不唯一,但是他们的长度是唯一的
解决方法:
蛮力算法(穷举法):
依次检查X的每个子序列是否在Y中出现,这种时间复杂度较高,不推荐
动态规划:
设 X=<x1,x2,…, xm>, Y=<y1,y2,…,yn>, Z =<z1,z2,…,zk> 为X和Y的LCS,那么 (1) 若 xm= yn ⇒zk = xm = yn, 且Zk-1 是Xm-1与Yn-1 的LCS;
(2) 若 xm ≠ yn , zk ≠ xm ⇒ Z 是 Xm-1 与 Y的LCS;
(3) 若 xm ≠ yn, zk ≠ yn ⇒ Z 是 X 与 Yn-1 的LCS.
满足最优子结构性质和子问题重叠性
子问题的递归结构:
由最优子结构性质性质可知:要找出X={x_1,x_2,…,x_m}和Y={y_1,y_2,…,y_n}的LCS,可按以下方式递归计算:
当x_m=y_n时,找出X_m−1和Y_n−1的最长公共子序列,然后在其尾部加上x_m(y_n)即可得到X 和Y的最长公共子序列;
当x_m≠y_n时,必须解两个子问题,即找出X_m−1和Y_n的一个最长公共子序列及X_m 和Y_n−1的一个最长公共子序列。这两个公共子序列中较长者即为X 和Y的最长公共子序列。
用c[i][j]记录序列X_i和Y_j的最长公共子序列的长度
当i=0或j=0时,空序列是X_i 和Y_j的最长公共子序列,此时c[i][j]=0
其他情况下,最优子结构性质递归关系如下:
计算最优值:
public static int clsLength(char[] a,char[] b,int[][] statu){
int m = a.length-1;
int n = b.length-1;
int[][] c = new int[m+1][n+1];
//如果有一个序列为空,那么他们的公共子序列为空
for(int i = 1;i<m;i++) c[i][0] = 0;
for(int i = 1;i<n;i++) c[0][i] = 0;
//从两个序列中取出子序列,逐步求出最长公共子序列
for(int i=1;i<=m;i++){
for(int j = 1;j<=n;j++){
if(a[i] == b[j]){
c[i][j] = c[i-1][j-1]+1;
//statu[i][j]表示最长公共子序列的3种情况;
statu[i][j]=1;
}else if(c[i-1][j]>=c[i][j-1]){
c[i][j] = c[i-1][j];
statu[i][j]=2;
}else {
c[i][j] = c[i][j-1];
statu[i][j]=3;
}
}
}
return c[m][n];
}
构造最长公共子序列:
public static void lcs(int i,int j,char [] x,int [][] statu)
{
//递归结束条件
if (i ==0 || j==0) return;
//根据最长公共子序列的三种情况求最长公共子序列
if (statu[i][j]== 1)
{
lcs(i-1,j-1,x,statu);
System.out.print(x[i]);
}
else if (statu[i][j]== 2) lcs(i-1,j,x,statu);
else lcs(i,j-1,x,statu);
}