问题描述:给定两个序列,例如 X = “ABCBDAB”、Y = “BDCABA”,求它们的最长公共子序列的长度。
下面是求解时的动态规划表,可以看出 X 和 Y 的最长公共子序列的长度为4:
输出一个最长公共子序列并不难(网上很多相关代码),难点在于输出所有的最长公共子序列,因为 LCS 通常不唯一。总之,我们需要在动态规划表上进行回溯 —— 从table[m][n],即右下角的格子,开始进行判断:
如果格子table[i][j]对应的X[i-1] == Y[j-1],则把这个字符放入 LCS 中,并跳入table[i-1][j-1]中继续进行判断;
如果格子table[i][j]对应的 X[i-1] ≠ Y[j-1],则比较table[i-1][j]和table[i][j-1]的值,跳入值较大的格子继续进行判断;(这里为什么选择更大的值呢?原因很简单,因为初始化的这个表,记录的就是当前路径所得到的最长的公共子序列!)
直到 i 或 j 小于等于零为止,倒序输出 LCS 。
如果出现table[i-1][j]等于table[i][j-1]的情况,说明最长公共子序列有多个,故两边都要进行回溯(这里用到递归)。
从上图的红色路径显示,X 和 Y 的最长公共子序列有 3 个,分别为 “BDAB”、“BCAB”、“BCBA”。
java源码:
import java.util.HashSet;
import java.util.TreeSet;
/**
* Created by Niu on 16/11/22.
*/
public class LCS {
private String str1;
private String str2;
private int[][] table;
private TreeSet<String> set=new TreeSet<>();
public LCS(String str1,String str2){
this.str1=str1;
this.str2=str2;
}
/**
初始化记录最大长度的表
**/
private int getLCS(){
int m=str1.length();
int n=str2.length();
table=new int[m+1][n+1];
for(int i=1;i<=m;i++){
for(int j=1;j<=n;j++){
if(str1.charAt(i-1)==str2.charAt(j-1)){
table[i][j]=table[i-1][j-1]+1;
}
else{
table[i][j]=Math.max(table[i-1][j],table[i][j-1]);
}
}
}
return table[m][n];
}
/**
* 回溯
*/
private void traceBack(int i,int j,String sb){
while(i>0&&j>0){
if(str1.charAt(i-1)==str2.charAt(j-1)){
sb+=(str1.charAt(i-1));
i--;j--;
}
else{
if(table[i-1][j]>table[i][j-1]){
i--;
}
else if(table[i-1][j]<table[i][j-1]){
j--;
}
else{
traceBack(i-1,j,sb);
traceBack(i,j-1,sb);
return ;//十分关键!!!!!!!
}
}
}
set.add(reverse(sb));
}
private String reverse(String s){
StringBuilder sb=new StringBuilder(s).reverse();
return sb.toString();
}
public void printLCS(){
int m=str1.length();
int n=str2.length();
int length=getLCS();
String s="";
traceBack(m,n,s);
System.out.print(length);
for (String str:set) {
System.out.println(str);
}
}
public static void main(String[] args){
LCS lcs=new LCS("ABCBDAB","BDCABA");
lcs.printLCS();
}
}
参考博客:http://blog.csdn.net/lisonglisonglisong/article/details/41596309