最长公共子序列
题目描述
字符序列的子序列是指从给定字符序列中随意地(不一定连续)去掉若干个字符(可能一个也不去掉)后所形成的字符序列。令给定的字符序列 X = x_0,x_1, ... ,x_m-1,序列 Y = y_0,y_1, ... ,y_k-1 是 X 的子序列,存在 X 的一个严格递增下标序列 i_0,i_1, ... ,i_k-1 ,使得对所有的j=0,1, ... ,k-1,有 x_ij=y_j 。例如,X=ABCBDAB ,Y=BCDB 是 X 的一个子序列。对给定的两个字符序列,求出他们最长的公共子序列长度,以及最长公共子序列个数。
输入描述
第一行为第一个字符序列,都是大写字母组成,以 . 结束。长度小于 5000。
第二行为第二个字符序列,都是大写字母组成,以 . 结束,长度小于 5000。
输出描述
第一行输出上述两个最长公共子序列的长度。
第二行输出所有可能出现的最长公共子序列个数,答案可能很大,只要将答案对 1×10^8 求余即可。
输入输出样例
输入
ABCBDAB.
BACBBD.
输出
4
7
运行限制
最大运行时间:1s
最大运行内存: 128M
1. 第一问
状态表示:
dp[i][j]代表:a的前i个字符与b的前j个字符最长公共子序列的长度。
状态转移:
当a[i-1]==b[j-1]
dp[i][j]代表一种状态,这种状态可以由a的前i-1个字符与b的前j-1个字符的最长公共子序列转移而来,即dp[i][j]=dp[i-1][j-1]+1
当a[i-1]!=b[j-1]
dp[i][j]可以由a的前i-1个字符与b的前j个字符的最长公共子序列转移而来也可以由a的前i个字符与b的前j-1个字符的最长公共子序列转移而来,即dp[i][j] = max(dp[i-1][j],dp[i][j-1])2. 第二问
状态表示:
cnt[i][j]代表:a的前i个字符与b的前j个字符最长公共子序列的个数。注意对cnt数组初始化最左边一列和最上边一行,例如cnt[0][2]的含义为a的前0个字符和b的前2个字符的最长公共子序列的个数为1.
状态转移:
若dp[i][j]==dp[i-1][j],说明状态是从dp[i-1][j]转移来的,cnt[i][j]要加上cnt[i-1][j]
若dp[i][j]==dp[i][j-1],说明状态是从dp[i][j-1]转移来的,cnt[i][j]要加上cnt[i][j-1]
若a[i]==b[j]且dp[i][j]==dp[i-1][j-1]+1,说明状态是从dp[i-1][j-1]转移来的,cnt[i][j]要加上cnt[i-1][j-1]
若a[i]!=b[j]且dp[i][j]==dp[i-1][j-1],那么状态cnt[i-1][j-1]会多加上一次,所以要让cnt[i][j]-=cnt[i-1][j-1]
注释:第四点中多加上了一次的原因是:dp[i-1][j]、dp[i][j-1]>=dp[i-1][j-1],又因为a[i]!=b[j]所以状态是从dp[i-1][j]、dp[i][j-1]中转移而来,且dp[i][j]==dp[i-1][j-1],所以dp[i-1][j-1]==dp[i-1][j]==dp[i][j-1],因此dp[i-1][j]与dp[i][j-1]也通过dp[i-1][j-1]转移了状态,一共转移了两次,重复了所以删去。本题若测试数据较大,需要用滚动数组优化,来减少内存,否则会MLE。
/*
动态规划DP 最长公共子序列(longest common subsequence)问题
*/
#include <bits/stdc++.h>
using namespace std;
int dp[3000][3000];
int cnt[3000][3000];
const int MOD = 1e8;
int main() {
string a, b;
cin >> a >> b;
int la = a.length() - 1;
int lb = b.length() - 1;
memset(dp, 0, sizeof(dp));
memset(cnt, 0, sizeof(cnt));
for (int i = 0; i < la; i++)
cnt[i][0] = 1;
for (int i = 0; i < lb; i++)
cnt[0][i] = 1;
for (int i = 1; i <= la; i++) {
for (int j = 1; j <= lb; j++) {
if (a[i - 1] == b[j - 1]) {
dp[i][j] = dp[i - 1][j - 1] + 1;
cnt[i][j] = cnt[i - 1][j - 1]; //状态可以从dp[i-1][j-1]转移
} else {
dp[i][j] = max(dp[i - 1][j], dp[i][j - 1]);
if (dp[i][j] == dp[i - 1][j - 1])
cnt[i][j] -= cnt[i - 1][j - 1]; //减去重复部分
}
if (dp[i - 1][j] == dp[i][j])
cnt[i][j] += cnt[i - 1][j]; //状态可以从dp[i-1][j]转移
if (dp[i][j - 1] == dp[i][j])
cnt[i][j] += cnt[i][j - 1]; //状态可以从dp[i][j-1]转移
cnt[i][j] %= MOD;
}
}
cout << dp[la][lb] << endl;
cout << cnt[la][lb] << endl;
return 0;
}