一、问题描述
求两个字符序列的公共最长子序列。例如字符序列abcbdb和字符序列acbbabdbb的最长公共子序列为acbdb。
二、问题分析
(1)用L[i][j]表示子序列xi和yj的最长公共子序列的长度,动态规划函数为
L[i][j] = L[i - 1][j - 1] + 1, xi等于yj
= max(L[i][j - 1], L[i - 1][j]), xi不等于yj
边界条件第0行和第0列均为0,即L[i][0] = L[0][j] = 0
上例中L填写情况如下
(2)因为不只要求出最大长度,还要寻找到公共最长子序列,所以在填表L[i][j]过程中,再填一个表S[i][j],
若xi等于yj,设置S[i][j] = 1;
若xi不等于yj,并且len[i + 1][j] >= len[i][j + 1],设置S[i][j] = 2;
若xi不等于yj,并且len[i + 1][j] < len[i][j + 1],设置S[i][j] = 3;
填表S[i][j]完成后,具体如何找到最长公共子序列详见代码注释。
上例中S填写情况及寻找最长公共子序列过程如下
三、算法代码
public static void maxCommonChar(char [] a, char [] b){
int m = a.length;
int n = b.length;
int [][] len = new int[m + 1][n + 1];//保存动态规划过程中的公共子串长度
int [][] flags = new int[m + 1][n + 1];//保存动态规划过程中的标志位
for(int i = 0; i <= m - 1; i++){//实现动态规划函数
for(int j = 0; j <= n - 1; j++){
if(a[i] == b[j]){//规划函数len[i + 1][j + 1] = len[i][j] + 1, a[i] == b[j]
len[i + 1][j + 1] = len[i][j] + 1;
flags[i + 1][j + 1] = 1; //设置标志位
}else if(len[i + 1][j] >= len[i][j + 1]){
len[i + 1][j + 1] = len[i + 1][j];
flags[i + 1][j + 1] = 2;
}else{
len[i + 1][j + 1] = len[i][j + 1];
flags[i + 1][j + 1] = 3;
}
}
}
int k = len[m][n]; //最长公共子串长度
char [] commonChars = new char[k];//保存最长公共子串
int i = m, j = n;
for(;i > 0 && j > 0;){
if(flags[i][j] == 1){//只有标志位为1相应位置上的字符才为公共字符
commonChars[k - 1] = a[i - 1];
k--;
i--;
j--;
}else if(flags[i][j] == 2){
j--;
}else{
i--;
}
}
System.out.println("最长公共子序列长度为:" + len[m][n]);
System.out.print("最长公共子序列为:");
for(int l = 0; l <= len[m][n] - 1; l++){
System.out.print(commonChars[l] + " ");
}
}
四、完整测试代码
public class package01 {
public static void main(String [] args){
char [] a = new char[]{'a', 'b', 'c', 'b', 'd', 'b'};
char [] b = new char[]{'a', 'c', 'b', 'b', 'a', 'b', 'd', 'b', 'b'};
maxCommonChar(a, b);
}
public static void maxCommonChar(char [] a, char [] b){
int m = a.length;
int n = b.length;
int [][] len = new int[m + 1][n + 1];//保存动态规划过程中的公共子串长度
int [][] flags = new int[m + 1][n + 1];//保存动态规划过程中的标志位
for(int i = 0; i <= m - 1; i++){//实现动态规划函数
for(int j = 0; j <= n - 1; j++){
if(a[i] == b[j]){//规划函数len[i + 1][j + 1] = len[i][j] + 1, a[i] == b[j]
len[i + 1][j + 1] = len[i][j] + 1;
flags[i + 1][j + 1] = 1; //设置标志位
}else if(len[i + 1][j] >= len[i][j + 1]){
len[i + 1][j + 1] = len[i + 1][j];
flags[i + 1][j + 1] = 2;
}else{
len[i + 1][j + 1] = len[i][j + 1];
flags[i + 1][j + 1] = 3;
}
}
}
int k = len[m][n]; //最长公共子串长度
char [] commonChars = new char[k];//保存最长公共子串
int i = m, j = n;
for(;i > 0 && j > 0;){
if(flags[i][j] == 1){//只有标志位为1相应位置上的字符才为公共字符
commonChars[k - 1] = a[i - 1];
k--;
i--;
j--;
}else if(flags[i][j] == 2){
j--;
}else{
i--;
}
}
System.out.println("最长公共子序列长度为:" + len[m][n]);
System.out.print("最长公共子序列为:");
for(int l = 0; l <= len[m][n] - 1; l++){
System.out.print(commonChars[l] + " ");
}
}
}
五、运行结果
最长公共子序列长度为:5
最长公共子序列为:a c b d b