给定两个字符串str1和str2,输出连个字符串的最长公共子序列。如过最长公共子序列为空,则输出-1。
例:s1={1,3,4,5,6,7,7,8},s2={3,5,7,4,8,6,7,8,2}
out:{3,5,7,7,8}
思路:如果是要寻找两个串的最长公共子序列的长度,可以利用以下递推公式:
令dp[i][j] 表示字符串S1前i个字符构成的子串 与 S2前j个字符构成的子串的LCS长度。
当s1[i-1]==s2[j-1],即两个子串的最后一个字符相同时,有dp[i][j1] =dp[i-1][j-1]+1
当两个子串的最后一个字符不相同时,有dp[i][j]=max(dp[i-1][j],dp[i][j-1])
即去掉s1最后一个字符后与s2的LCS、去掉s2最后一个字符后与s1的LCS 中的最大值
当填写完dp表,此时下标为0的行、列值为0,dp[s1.length][s2.length]为两个串的LCS长度。
在此基础之上,可以由dp表倒推得到LCS。
原理:
若s1和s2长度为1,那么如果元素相同,则加入LCS,否则算法结束。
若s1 和 s2末尾元素相同,那么这个元素加入LCS,去掉两串的尾元素,继续考察。
若s1和s2末尾元素不同,那么考察dp[i-1][j]和dp[i][j-1]的大小,取其中较大值,考察s1的前i-1个元素与s2的前j个元素或者s1的前i个元素与s2的前j-1个元素。
import java.util.*;
public class LCS {
/**
* longest common subsequence
*
* @param s1 string字符串 the string
* @param s2 string字符串 the string
* @return string字符串
*/
static StringBuilder sb = new StringBuilder();
static char[] c1, c2;
static int[][] dp;
public static String LCS(String s1, String s2) {
int m = s1.length(), n = s2.length();
c1 = s1.toCharArray();
c2 = s2.toCharArray();
dp = new int[m + 1][n + 1];
for (int i = 1; i <= m; i++) {
for (int j = 1; j <= n; j++) {
if (c1[i - 1] == c2[j - 1]) {
dp[i][j] = dp[i - 1][j - 1] + 1;
} else {
dp[i][j] = Math.max(dp[i - 1][j], dp[i][j - 1]);
}
}
}
// 逆向构造最长子序列
gen(m, n);
return sb.reverse().toString();
}
static void gen(int i, int j) {
if (i == 0 || j == 0) {
return;
}
if (c1[i - 1] == c2[j - 1]) {
sb.append(c1[i - 1]);
gen(i - 1, j - 1);
} else {
if (dp[i - 1][j] >= dp[i][j - 1]) {//横向优先
//if (dp[i - 1][j] > dp[i][j - 1]) {//纵向优先
gen(i - 1, j);
} else {
gen(i, j - 1);
}
}
}
public static void main(String[] args) {
System.out.println(LCS("1A2C3D4B56", "B1D23CA45B6A"));
// System.out.println(LCS("abc", "123abc"));
}
}