子序列
在一个序列中按顺序取出部分元素(不需要连续),组成的序列称为它的子序列。
最长公共子序列LCS
举个例子,
3 2 1 4 5
1 2 3 4 5
它们的最长公共子序列就是3 4 5 或 2 4 5 或 1 4 5
求LCS
第一种方法
动态规划的方法,复杂度为O(n^2)
假设有数组a和数组b,dp[i][j]定义为数组a前i个元素和数组b前j个元素的最长公共子序列。
可以轻松发现规律:
当a[i]和b[j]不等时,dp[i][j] = max(dp[i-1][j],dp[i][j-1]);
当a[i]和b[j]相等时,dp[i][j] = dp[i-1][j-1]+1;
该方法较为容易,就不细讲了,读者可以自己在纸上模拟过程验证以下,我直接给上代码:
#include <bits/stdc++.h>
#define maxn 1000
using namespace std;
int n;
int a[maxn+1];//0号位不用
int b[maxn+1];
int dp[maxn+1][maxn+1];
int main(int argc, char *argv[]) {
cin>>n;
for(int i=1; i<=n; i++){
cin>>a[i];
}
for(int i=1; i<=n; i++){
cin>>b[i];
}
for(int i=1; i<=n; i++){
for(int j=1; j<=n; j++){
if(a[i] == b[j]){
dp[i][j] = dp[i-1][j] + 1;
}
else{
dp[i][j] = max(dp[i][j], dp[i][j-1]);
}
}
}
cout<<dp[n][n]<<endl;
/*
//也可用滚动数组缩小空间:
for(int i=1; i<=n; i++){
int last = dp[0];//用来记录dp上一行j-1的元素
for(int j=1; j<=n; j++){
int temp = dp[j];
if(a[i] == b[j]){
dp[j] = last + 1;
}
else{
dp[j] = max(dp[j], dp[j-1]);
}
last = temp;
//cout<<dp[j]<<' ';
}
//cout<<endl;
}
cout<<dp[n]<<endl;
*/
return 0;
}
第二种方法
第一种方法时间复杂度为O(n^2),算法竞赛中,一般当n为10000及以上时,该方法就会超时。所以下面给出第二种方法,时间复杂度大概为O(nlogn).
举个例子,
a : 3 2 1 4 5
b : 4 3 2 1 5
假如肉眼观察的话,我们能很轻松地发现答案为3 2 1 5,长度为4
细化我们的观察过程,可以发现:
对于b中的每个元素,找到它在a中的位置,
如果几个元素在b中是顺序出现的,并且它们在a中的位置也是顺序出现的,那么它们就是两者的公共子序列,例如b中的3 2 1 5,在a中的位置也是顺序出现的,所以3 2 1 5就是a和b的公共子序列。在这样的公共子序列中,最长的就是两者的最长公共子序列。
如果我们用数组m[]记录b中每个元素在a中的位置:
b : 4 3 2 1 5
m : 4 1 2 3 5
m中最长递增子序列为1 2 3 5,对应b中的序列为3 2 1 5,说明b中该序列在a中是顺序出现的并且也是最长的,所以3 2 1 5为a和b的最长公共子序列。
综上,求a和b的最长公共子序列的长度,就转化为了求m的最长递增子序列的长度。
这里涉及到了求最长递增子序列的知识,可以看看我的另一篇笔记:
LIS 笔记
对于第二种方法,我推荐一道题目并给出AC代码:
洛谷 P1439 最长公共子序列
#include <bits/stdc++.h>
#define maxn 100000
using namespace std;
int n;
int a[maxn+5];
int b[maxn+5];
int m[maxn+5];//记录读入的数据中 每一个数在数组a中的序号
//0号位不用
int dp[maxn+5];
int main(int argc, char *argv[]){
cin>>n;
for(int i=1; i<=n; i++){
cin>>a[i];
m[a[i]] = i;
}
for(int i=1; i<=n; i++){
cin>>b[i];
}
memset(dp, -1, sizeof(dp));
int len=1;
dp[len] = m[b[1]];
for(int i=2; i<=n; i++){
if(m[b[i]] > dp[len]){
dp[++len] = m[b[i]];
}
else{
//在dp[1]到dp[len]中查找第一个大于map[b[i]]的数并替换为map[b[i]]
int j = lower_bound(dp+1, dp+len+1, m[b[i]]) - dp;
dp[j] = m[b[i]];
}
}
for(int i=1; i<=n+1; i++){
//cout<<dp[i]<<endl;
if(dp[i] == -1){
cout<<i-1<<endl;
break;
}
}
return 0;
}