最长上升子序列 Longest Increasing Subsequence n^2和nlogn算法

最新推荐文章于 2024-06-19 21:21:43 发布

gwq5210

最新推荐文章于 2024-06-19 21:21:43 发布

阅读量1.4k

点赞数

分类专栏：动态规划文章标签：最长上升子序列 Longest Increasing S LIS n2和nlogn算法

本文链接：https://blog.csdn.net/gwq5210/article/details/40555237

版权

动态规划专栏收录该内容

27 篇文章 0 订阅

订阅专栏

最长上升子序列 Longest Increasing Subsequence

最长上升子序列，英文全程为Longest Increasing Subsequence，简称LIS，这个问题是一个经典的动态规划问题。

先来介绍一下最长上升子序列的定义，设有n个数，a1，a2，a3，... ，an，如果ai1<ai2<...<aik，其中1<=i1<i2<i3<...<ik<=n，那么ai1，ai2，...，aik，就是这n个数的上升子序列，所有的上升子序列中，最长的那个叫做最长上升子序列，显然，最长上升子序列可能不止一个，就是说可能存在多个上升序列，它们的长度相等，并且是最长的。

求解这个问题有两种算法，复杂分别是n^2和nlogn，但基本的思想都是动态规划，不同的是，第二中方法利用了二分的思想，将复杂度降到了nlogn。

解法一（n^2算法）：

我们用一维的数组表示状态，即dp[i]表示以第i个数结尾的最长上升子序列的最长长度，那么很容易推出状态转移方程dp[i] = max(dp[j]+1)，其中1<=j<i，并且aj<ai。

这个算法比较容易理解，我们还能在求的过程中记录下来这个最长上升子序列。

另一个思路是: 对序列X进行排序得到X’, 然后求X和X’的最长公共子序列就得到了该序列的最长单调递增子序列.这个方法也是n^2的.

代码如下：

/*************************************************************************
	> File Name: lis_n2.cpp
	> Author: gwq
	> Mail: gwq5210@qq.com 
	> Created Time: 2014年10月30日 星期四 16时42分25秒
 ************************************************************************/

#include <cmath>
#include <ctime>
#include <cctype>
#include <climits>
#include <cstdio>
#include <cstdlib>
#include <cstring>

#include <map>
#include <set>
#include <queue>
#include <stack>
#include <vector>
#include <sstream>
#include <iostream>
#include <algorithm>

#define INF (INT_MAX / 10)
#define clr(arr, val) memset(arr, val, sizeof(arr))
#define pb push_back
#define sz(a) ((int)(a).size())

using namespace std;
typedef set<int> si;
typedef vector<int> vi;
typedef map<int, int> mii;
typedef long long ll;

const double esp = 1e-5;

#define N 10010

int num[N], dp[N], pre[N];

int main(int argc, char *argv[])
{
	int n;

	while (scanf("%d", &n) != EOF) {
		for (int i = 0; i < n; ++i) {
			scanf("%d", &num[i]);
		}

		//初始化,以第i个数为终点的最长上升序列长度为1
		//其前驱为-1，即没有前驱
		for (int i = 0; i < n; ++i) {
			dp[i] = 1;
			pre[i] = -1;
		}
		for (int i = 1; i < n; ++i) {
			//找到最优解，并记录前驱节点
			for (int j = 0; j < i; ++j) {
				if (num[j] < num[i] && dp[i] < dp[j] + 1) {
					dp[i] = dp[j] + 1;
					pre[i] = j;
				}
			}
		}

		int pos = 0;
		int max = 0;
		for (int i = 0; i < n; ++i) {
			if (max < dp[i]) {
				max = dp[i];
				pos = i;
			}
		}

		//记录的是逆序的，所以要倒序输出
		int u = pos;
		stack<int> s;
		while (u != -1) {
			s.push(num[u]);
			u = pre[u];
		}
		printf("%d\n", max);
		for (int i = 0; i < max; ++i) {
			printf("%d%c", s.top(), (i == max - 1) ? '\n' : ' ');
			s.pop();
		}
	}

	return 0;
}

解法二（nlogn）：

上述算法已经能很好的解决最长上升子序列的问题了，但是，效率是n^2，不尽如人意，所以，就有了这个改进的nlogn算法，原理是引入了二分思想，即在前i-1个数里查找最优解的时候，经过特殊处理，使得能满足二分查找的性质。

首先考虑一种情况，如果dp[i]==d[j]，但是num[i]<num[j]，那么我们选择那个好呢，显然，选择以num[i]为结尾的序列更优潜力，因为可能存在一个k，使得num[i] < num[k] < num[j]，可以使以num[i]为结尾的序列变长，但却不能使以num[j]为结尾的序列边长。那么我们如果知道长度为i的所有序列中结尾数字最小的那个数，就可以知道能否得到一个更长的序列，设用d[i]表示长度为i的序列结尾的最小数字，那么我们就可以维护这个数组，来求得最长公共子序列的长度。

首先，数组d有两个性质，第一，对于数组中的某个元素，如d[k]，d[k]在更新的过程中不可能增大；第二，对于整个数组d，这个数组是严格递增的，这个也很容易理解，子序列长度为i+1的结尾的数字至少要比子序列长度为i的结尾的数字大，否则，就构不成长度为i+1的序列。

有了这两个性质，我们就可以用二分法来更新这个数组，具体方法是，初始，最长公共子序列的长度len为1，d[1] = num[1]，每读入一个元素num[i]，如果d[len] < num[i]，那么令d[++len] = num[i]，否则，二分找到pos，使得d[pos - 1] < num[i]并且num[i] <= d[pos]，然后，将d[pos]赋值为num[i]。

代码如下：

/*************************************************************************
	> File Name: lis_nlogn.cpp
	> Author: gwq
	> Mail: gwq5210@qq.com 
	> Created Time: 2014年10月30日 星期四 16时42分25秒
 ************************************************************************/

#include <cmath>
#include <ctime>
#include <cctype>
#include <climits>
#include <cstdio>
#include <cstdlib>
#include <cstring>

#include <map>
#include <set>
#include <queue>
#include <stack>
#include <vector>
#include <sstream>
#include <iostream>
#include <algorithm>

#define INF (INT_MAX / 10)
#define clr(arr, val) memset(arr, val, sizeof(arr))
#define pb push_back
#define sz(a) ((int)(a).size())

using namespace std;
typedef set<int> si;
typedef vector<int> vi;
typedef map<int, int> mii;
typedef long long ll;

const double esp = 1e-5;

#define N 10010

int num[N], d[N], len;

int find(int idx)
{
	int l = 1;
	int r = len - 1;
	//二分找到更新的位置
	while (l <= r) {
		int mid = (l + r) >> 1;
		if (num[idx] > d[mid] && num[idx] <= d[mid + 1]) {
			return mid + 1;
		} else if (num[idx] > d[mid]) {
			l = mid + 1;
		} else {
			r = mid - 1;
		}
	}

	//找不到，就更新d[1]，这个一定是长度为1的最小的
	//否则，就到不了这一步了
	return 1;
}

int main(int argc, char *argv[])
{
	int n;

	while (scanf("%d", &n) != EOF) {
		for (int i = 0; i < n; ++i) {
			scanf("%d", &num[i]);
		}

		len = 1;
		d[1] = num[0];
		for (int i = 1; i < n; ++i) {
			if (d[len] < num[i]) {
				d[++len] = num[i];
			} else {
				int pos = find(i);
				d[pos] = num[i];
			}
		}

		printf("%d\n", len);
	}

	return 0;
}

上述两种算法各有优点，第一种可以记录得到的最长子序列，第二种算法就记录不了，但是效率得到了提升。