题目:
给定两个字符串 text1 和 text2,返回这两个字符串的最长 公共子序列 的长度。如果不存在 公共子序列 ,返回 0 。
一个字符串的 子序列 是指这样一个新的字符串:它是由原字符串在不改变字符的相对顺序的情况下删除某些字符(也可以不删除任何字符)后组成的新字符串。
- 例如,“ace” 是 “abcde” 的子序列,但 “aec” 不是 “abcde” 的子序列。
两个字符串的 公共子序列 是这两个字符串所共同拥有的子序列。
示例一:
输入:text1 = “abcde”, text2 = “ace”
输出:3
解释:最长公共子序列是 “ace” ,它的长度为 3 。
示例二:
输入:text1 = “abc”, text2 = “abc”
输出:3
解释:最长公共子序列是 “abc” ,它的长度为 3 。
示例三:
输入:text1 = “abc”, text2 = “def”
输出:0
解释:两个字符串没有公共子序列,返回 0 。
提示:
- 1 <= text1.length, text2.length <= 1000
- text1 和 text2 仅由小写英文字符组成。
分析:
简单介绍一下动态规划的双序列问题,双序列问题的输入有两个或更多的序列,通常是两个字符串或数组。由于输入是两个序列,因此状态转移方程通常有两个参数,即f(i,j),定义第一个序列中下标从0到i的子序列和第二个序列中从0到j的子序列的最优解。一旦找到f(i,j),f(i-1,j),f(i,j-1)的关系,通常问题也就迎刃而解了。
如果第一个字符串中下标为i的字符和第二个字符串中下标为j的字符相同,那么f(i,j)就相当于在s1[0…i-1]和s2[0…j-1]的最长公共子序列的后面添加一个公共字符,也就是f(i,j)=f(i-1,j-1)+1(s1[i]=s2[j])
反之如果对应下标的两个字符不同,那么这两个字符就不能同时出现在s1[0…i],s2[0…j]的公共子序列中,要么是在s1[0…i-1],s2[0…j]的最长公共子序列,要么是出现在在s1[0…i],s2[0…j-1]的最长公共子序列,也就是说f(i,j)是f(i-1,j)和f(i,j-1)的最大值。
当状态转移方程的i或j等于0时,即求f(0,j)或f(i,0)时可能需要f(-1,j)或f(i,-1)的值,f(-1,j)或f(i,-1)公共子序列的长度都是0,因此f(-1,j)或f(i,-1)都等于0。
用自下而上的方式来计算状态转移方程,这个过程可以看成一个表格的填充过程,用下列表格来保存f(i,j)的计算结果。
还可以进一步优化空间效率,只需要用一个一维数组就能保存所有计算所需的信息。这个一维数组的长度是表格的列数(即输入字符串s2的长度加1),为了让一个一维数组保存表格的上下两行信息,即f(i,j)和f(i-1,j)都保存在数组dp下标j+1的位置。在计算f(i,j)之前,dp[j+1]中保存的是f(i-1,j)的值,在完成f(i,j)的计算后,dp[j+1]被f(i,j)的值所替换。在计算f(i,j)之前,dp[j+1]中保存的是f(i-1,j)的值,因此在计算f(i,j)之后不能直接用f(i,j)的值替换dp[j+1]中保存的是f(i-1,j)的值,这样在下一步在计算f(i,j+1)时,还能得到f(i-1,j)的值。
如上图,通过上一行一维数组推导出下一行一维数组。cur代表当前值,prev也从上一行数组的0下标一直右移。
代码:
public class LongestCommonSubsequence {
public static void main(String[] args) {
LongestCommonSubsequence longestCommonSubsequence = new LongestCommonSubsequence();
int i = longestCommonSubsequence.longestCommonSubsequence3("abcde", "badfe");
System.out.println(i);
}
// 该解法空间复杂度是O(mn)
public int longestCommonSubsequence1(String text1, String text2) {
int len1 = text1.length();
int len2 = text2.length();
int[][] dp = new int[len1+1][len2+1];
for (int i = 0; i < len1; i++) {
for (int j = 0; j < len2; j++) {
if (text1.charAt(i)==text2.charAt(j)){
dp[i+1][j+1] = dp[i][j] + 1;
}else {
dp[i+1][j+1] = Math.max(dp[i][j+1],dp[i+1][j]);
}
}
}
return dp[len1][len2];
}
// 优化空间复杂度,只保存表格中的两行
public int longestCommonSubsequence2(String text1, String text2){
int len1 = text1.length();
int len2 = text2.length();
int[][] dp = new int[2][len2+1];
for (int i = 0; i < len1; i++) {
for (int j = 0; j < len2; j++) {
if (text1.charAt(i)==text2.charAt(j)){
dp[(i+1)%2][j+1] = dp[i%2][j] + 1;
}else {
dp[(i+1)%2][j+1] = Math.max(dp[i%2][j+1],dp[(i+1)%2][j]);
}
}
}
return dp[len1%2][len2];
}
// 再进一步优化空间效率,只需要一个一维数组
public int longestCommonSubsequence3(String text1, String text2){
int len1 = text1.length();
int len2 = text2.length();
if (len1<len2){
return longestCommonSubsequence3(text2,text1);
}
// 一维数组的长度就是表格的列数,空间复杂度为O(min(m,n))
int[] dp = new int[len2+1];
for (int i = 0; i < len1; i++) {
// prev用来保存数组中被替换的值
int prev = dp[0];
for (int j = 0; j < len2; j++) {
// cur代表f(i,j)
int cur;
if (text1.charAt(i) == text2.charAt(j)){
cur = prev + 1;
}else {
cur = Math.max(dp[j],dp[j+1]);
}
// 在保存f(i,j)之前,将保存在dp[j+1]中的值(f(i-1,j))临时保存到变量prev中\
// 下一步计算f(i,j+1)时可以从变量prev中得到f(i-1,j)
prev = dp[j+1];
dp[j+1] = cur;
}
}
return dp[len2];
}
}