一个字符串S,去掉零个或者多个元素所剩下的子串称为S的子序列。最长公共子序列就是寻找两个给定序列的子序列,该子序列在两个序列中以相同的顺序出现,但是不必要是连续的。
例如序列X=ABCBDAB,Y=BDCABA。序列BCA是X和Y的一个公共子序列,但是不是X和Y的最长公共子序列,子序列BCBA是X和Y的一个LCS,序列BDAB也是。
寻找LCS的一种方法是枚举X所有的子序列,然后注意检查是否是Y的子序列,并随时记录发现的最长子序列。假设X有m个元素,则X有2^m个子序列,指数级的时间,对长序列不实际。
使用动态规划求解这个问题,先寻找最优子结构。设X=
/**
* 最长公共子序列(可不连续)
* @author 过路的守望
*
*/
public class LongestCommonSequence {
public static void main(String[] args) {
System.out.println(getLongestCommonSequence("abcfbc", "abfcab"));
}
public static String getLongestCommonSequence(String A,String B){
int a_len = A.length();
int b_len = B.length();
int[][]dp = new int[a_len+1][b_len+1];
/**
* 定义三个状态-1,0,1,分别代表左边,上面,左上。
*/
int[][]pre = new int[a_len+1][b_len+1];
int size = 0;
StringBuilder sb = new StringBuilder();
/**
* dp[i][j] = dp[i-1][j-1]+1 ,A[i]=A[j]
* dp[i][j] = Math.max(dp[i][j-1],dp[i-1][j]) A[i]!=A[j];
* 边界考虑i,j下标从1开始。
*/
for(int i = 1;i<=a_len;i++){
char a = A.charAt(i-1);
for(int j = 1;j<=b_len;j++){
char b = B.charAt(j-1);
if(a == b){
dp[i][j] = dp[i-1][j-1]+1;
pre[i][j] = 0;
if(dp[i][j]>size){
size = dp[i][j];
}
}else if(dp[i][j-1]>=dp[i-1][j]) {
dp[i][j] = dp[i][j-1];
pre[i][j] = -1;
}else {
dp[i][j] = dp[i-1][j];
pre[i][j] = 1;
}
}
}
int i = a_len;
int j = b_len;
/**
* 输出子序列
*/
while(i>0&&j>0){
if(pre[i][j]==0){
sb.append(A.charAt(i-1));
i--;
j--;
}else if(pre[i][j]==1){
i--;
}else {
j--;
}
}
return sb.reverse().toString();
}
}