一、例题:
给定两个长度分别为 NN 和 MM 的字符串 AA 和 BB,求既是 AA 的子序列又是 BB 的子序列的字符串长度最长是多少。
输入格式
第一行包含两个整数 NN 和 MM。
第二行包含一个长度为 NN 的字符串,表示字符串 AA。
第三行包含一个长度为 MM 的字符串,表示字符串 BB。
字符串均由小写字母构成。
输出格式
输出一个整数,表示最大长度。
数据范围
1≤N,M≤10001≤N,M≤1000
输入样例:
4 5
acbd
abedc
输出样例:
3
二、思路
f[i][j]
表示a
的前i
个字母,和b
的前j
个字母的最长公共子序列长度,可以用四类情况表示
- 00 表示既不包含
a[i]
也不包含b[j]
- 01表示不包含
a[i]
包含b[j]
- 10表示包含
a[i]
不包含b[j]
- 11表示包含
a[i]
也包含b[j]
,并且a[i]
、b[j]
分别是a
的前i
个字母,和b
的前j
个字母的两个子序列的最后一个值,所以一定是这两个子序列的公共序列的最后一个值,故a[i]
一定等于b[j]
怎么表示?
问题来了,第一类和第四类很好描述,但第二类和第三类怎么描述呢?
图中的f[i-1][j]
和f[i][j-1]
并没有精确描述,以第二类为例
第二类01表示不包含a[i]
包含b[j]
,一定是没有a[i]
但一定有b[j]
的
但f[i-1][j]
描述的是a
的前i-1
个字母,和b
的前j
个字母的最长公共子序列长度,可能是没有b[j]
的
但第二类情况是包含在f[i-1][j]
的表示范围中的,换句话说f[i-1][j]
一定有01的情况,只是会出现重复,但因为此题是求集合的最大值的属性,所以重复无所谓(一般dp问题求集合的最大值、最小值和数量,在求最大最小的时候重复无所谓,但求数量的时候不能重复)
上述为第二类情况,第三类同理,但第二类和第三类的两种表示f[i-1][j]
和f[i][j-1]
一定是包含了f[i-1][j-1]
的,所以第一类情况是可以不写的,一般代码中只需要体现二三四类代码即可。
三、代码(时间复杂O(n2 ))
import java.util.Scanner;
public class Main {
public static void main(String[] args) {
Scanner in = new Scanner(System.in);
int n = in.nextInt();
int m = in.nextInt();
char[] a = new char[n + 10];
char[] b = new char[m + 10];
String a_s = in.next();
String b_s = in.next();
int[][] f = new int[1005][1005];
for (int i = 1; i <= a_s.length(); i++) a[i] = a_s.charAt(i-1);
for (int i = 1; i <= b_s.length(); i++) b[i] = b_s.charAt(i-1);
for (int i = 1; i <= n; i++) {
for (int j = 1; j <= m; j++) {
f[i][j] = Math.max(f[i-1][j],f[i][j-1]);
if (a[i] == b[j]) {
f[i][j] = Math.max(f[i][j],f[i-1][j-1]+1);
}
}
}
System.out.println(f[n][m]);
}
}