1143. 最长公共子序列
1、题目
最长公共子序列(Longest Common Subsequence, LCS)问题是一个经典的计算机科学和算法设计问题。这个问题可以描述如下:
给定两个序列X和Y,我们的任务是找到这两个序列的一个最长的子序列,这个子序列不需要在原序列中连续出现,但必须保持元素的相对顺序。
例如,假设我们有两个序列:
X: A, B, C, D, E
Y: B, D, C, E, F
一个可能的最长公共子序列是B, C, E,长度为3。
2、题目分析
一种解决LCS问题的方法是使用动态规划。我们可以定义一个二维数组dp,其中dp[i][j]表示考虑X的前i个元素和Y的前j个元素时得到的最长公共子序列的长度。
状态转移方程为:
当X[i] == Y[j]时,dp[i][j] = dp[i-1][j-1] + 1
当X[i] != Y[j]时,dp[i][j] = max(dp[i-1][j], dp[i][j-1])
最终的答案将是dp[m][n],其中m和n分别是序列X和Y的长度。
3、解题步骤
dp五部曲
1.定状态:(思考是否满足动规的3个特性)
dp数组:dp[n + 1][M + 1];
下标的含义:i,j表示截止到A串的第i字符,及截止到B串的第j字符,两串的最长公共子序列
2.推方程(分场景推导方程)
若 A[i - 1] == B[j - 1],dp[i][j] = dp[i - 1][j - 1] + 1; (若A串第i个字符、B串第j个字符相等,则当前2串的最长公共子序列 = A、B串各不包含i、j字符的子串的最长公共子序列 + 1,这里的加 1 是因为 i和j 相等)
若 若 A[i - 1] != B[j - 1],dp[i][j] = max(dp[i][j - 1], dp[i - 1][j]) (若A串第i个字符、B串第j个字符 不相等,则当前2串的最长公共子序列 = max(A串不含i字符、B串含j字符, A串含i字符、B串不含j字符)
3.初始化
dp数组第0行、及第0列初始化为0,表示当另一个数组为空时,两者没有公共子序列
4.遍历
由第2点的状态转移方程可知,本状态可由3个方向的状态转移而来:左、上、左上。故i从小到大、j从小到大
5.举例
4、复杂度最优解代码示例
public static int longestCommonSubsequence(String text1, String text2) {
int n = text1.length();
int m = text2.length();
int[][] dp = new int[n + 1][m + 1];
for (int i = 1; i <= n; i++) {
for (int j = 1; j <= m; j++) {
// 遍历2个串,处理dp数组
if (text1.charAt(i - 1) == text2.charAt(j - 1)) {
// 1.如果串1第i个字符 = 串2第j个字符,则dp[i][j] = 串1不含i字符、串2不含j字符时的最长公共子序列长度 + 1
dp[i][j] = dp[i - 1][j - 1] + 1;
} else {
// 2.如果串1第i个字符 != 串2第j个字符,则dp[i][j] = max(串1不含i字符、串2含j字符, 串1含i字符、串2不含j字符)时的最长公共子序列长度 + 1
dp[i][j] = Math.max(dp[i][j - 1], dp[i - 1][j]);
}
}
}
// 返回串1、串2截止到最后一个字符的最长公共子序列长度
return dp[n][m];
}
5、抽象与扩展
通用动态规划的解法,见标题二