LCS 最长公共子序列

最新推荐文章于 2024-08-05 20:49:33 发布

innerdolphin

最新推荐文章于 2024-08-05 20:49:33 发布

阅读量393

点赞数

分类专栏： DP 文章标签：动态规划算法 c++

本文链接：https://blog.csdn.net/m0_51183899/article/details/122391350

版权

DP 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

子序列

在一个序列中按顺序取出部分元素（不需要连续），组成的序列称为它的子序列。

最长公共子序列LCS

举个例子，
3 2 1 4 5
1 2 3 4 5
它们的最长公共子序列就是3 4 5 或 2 4 5 或 1 4 5

求LCS

第一种方法
动态规划的方法，复杂度为O(n^2)
假设有数组a和数组b，dp[i][j]定义为数组a前i个元素和数组b前j个元素的最长公共子序列。
可以轻松发现规律：
当a[i]和b[j]不等时，dp[i][j] = max(dp[i-1][j],dp[i][j-1]);
当a[i]和b[j]相等时，dp[i][j] = dp[i-1][j-1]+1;
该方法较为容易，就不细讲了，读者可以自己在纸上模拟过程验证以下，我直接给上代码：

#include <bits/stdc++.h>
#define maxn 1000
using namespace std;



int n;
int a[maxn+1];//0号位不用
int b[maxn+1];
int dp[maxn+1][maxn+1];

int main(int argc, char *argv[]) {
	cin>>n;
	for(int i=1; i<=n; i++){
		cin>>a[i];
	}
	for(int i=1; i<=n; i++){
		cin>>b[i];
	}
	for(int i=1; i<=n; i++){
		for(int j=1; j<=n; j++){
			if(a[i] == b[j]){
				dp[i][j] = dp[i-1][j] + 1;
			}
			else{
				dp[i][j] = max(dp[i][j], dp[i][j-1]);
			}
		}
	}
	cout<<dp[n][n]<<endl;
	/*
	//也可用滚动数组缩小空间： 
	for(int i=1; i<=n; i++){
		int last = dp[0];//用来记录dp上一行j-1的元素
		for(int j=1; j<=n; j++){
			int temp = dp[j];
			if(a[i] == b[j]){
				dp[j] = last + 1;
			}
			else{
				dp[j] = max(dp[j], dp[j-1]);
			}
			last = temp;
			//cout<<dp[j]<<' ';
		}
		//cout<<endl;
	}
	cout<<dp[n]<<endl;
	*/
	return 0;
}

第二种方法

第一种方法时间复杂度为O(n^2)，算法竞赛中，一般当n为10000及以上时，该方法就会超时。所以下面给出第二种方法，时间复杂度大概为O(nlogn).
举个例子，
a : 3 2 1 4 5
b : 4 3 2 1 5
假如肉眼观察的话，我们能很轻松地发现答案为3 2 1 5，长度为4
细化我们的观察过程，可以发现：
对于b中的每个元素，找到它在a中的位置，
如果几个元素在b中是顺序出现的，并且它们在a中的位置也是顺序出现的，那么它们就是两者的公共子序列，例如b中的3 2 1 5，在a中的位置也是顺序出现的，所以3 2 1 5就是a和b的公共子序列。在这样的公共子序列中，最长的就是两者的最长公共子序列。

如果我们用数组m[]记录b中每个元素在a中的位置：
b : 4 3 2 1 5
m : 4 1 2 3 5
m中最长递增子序列为1 2 3 5，对应b中的序列为3 2 1 5，说明b中该序列在a中是顺序出现的并且也是最长的，所以3 2 1 5为a和b的最长公共子序列。
综上，求a和b的最长公共子序列的长度，就转化为了求m的最长递增子序列的长度。
这里涉及到了求最长递增子序列的知识，可以看看我的另一篇笔记：
LIS 笔记

对于第二种方法，我推荐一道题目并给出AC代码：
洛谷 P1439 最长公共子序列

#include <bits/stdc++.h>
#define maxn 100000
using namespace std; 

int n;
int a[maxn+5];
int b[maxn+5];
int m[maxn+5];//记录读入的数据中 每一个数在数组a中的序号 
//0号位不用

int dp[maxn+5];
 
int main(int argc, char *argv[]){
	cin>>n;
	for(int i=1; i<=n; i++){
		cin>>a[i];
		m[a[i]] = i;
	}
	for(int i=1; i<=n; i++){
		cin>>b[i];
	}
	memset(dp, -1, sizeof(dp));
	int len=1;
	dp[len] = m[b[1]];
	for(int i=2; i<=n; i++){
		if(m[b[i]] > dp[len]){
			dp[++len] = m[b[i]];
		}
		else{
			//在dp[1]到dp[len]中查找第一个大于map[b[i]]的数并替换为map[b[i]] 
			int j = lower_bound(dp+1, dp+len+1, m[b[i]]) - dp;
			dp[j] = m[b[i]];
		}
	}
	for(int i=1; i<=n+1; i++){
		//cout<<dp[i]<<endl;
		if(dp[i] == -1){
			cout<<i-1<<endl;
			break;
		}
	}
	return 0;
}