先搞明白两个概念,最长公共子序列 和 最长公共字串的区别,两者最大的区别是,最长公共子序列不要求连续性,而最长公共字串要求连续:
例如:X = “abcder”,Y = “abcxyr”,这两个字符串的最长公共子序列是 “abcr”,而他们的最长公共字串是“abc”
我们用动态规划法来求解最长公共子序列,因为最长公共子序列具有最有子结构性质,可以分成子问题来递归求最优解,最后组合子问题求解出问题。用c[i][j]记录X[i]与Y[j] 的LCS 的长度,求解问题c[i,j],可以分成c[i-1][j-1]、c[i-1][j]、c[i][j-1]子问题来求解,依次递堆到最小子问题,动态规划的递归式描述为:
计算c[i][j]矩阵,利用矩阵可以输出最长公共子序列字符,具体代码如下:
//返回两个字符串的最长公共子序列的长度
public static int[][] lcs(String str1, String str2) {
int[][] matrix = new int[str1.length() + 1][str2.length() + 1];//建立二维矩阵
// 初始化边界条件
for (int i = 0; i <= str1.length(); i++) {
matrix[i][0] = 0;//每行第一列置零
}
for (int j = 0; j <= str2.length(); j++) {
matrix[0][j] = 0;//每列第一行置零
}
// 填充矩阵
for (int i = 1; i <= str1.length(); i++) {
for (int j = 1; j <= str2.length(); j++) {
if (str1.charAt(i - 1) == str2.charAt(j - 1)) {
matrix[i][j] = matrix[i - 1][j - 1] + 1;
} else {
matrix[i][j] = (matrix[i - 1][j] >= matrix[i][j - 1] ? matrix[i - 1][j]
: matrix[i][j - 1]);
}
}
}
return matrix;
}
//根据矩阵输出LCS
private static void lcsPrint(int[][] opt, String X, String Y, int i, int j) {
if (i == 0 || j == 0) {
return;
}
if (X.charAt(i - 1) == Y.charAt(j - 1)) {
lcsPrint(opt, X, Y, i - 1, j - 1);
System.out.print(X.charAt(i - 1));
} else if (opt[i - 1][j] >= opt[i][j]) {
lcsPrint(opt, X, Y, i - 1, j);
} else {
lcsPrint(opt, X, Y, i, j - 1);
}
}