最长上升子序列 Longest Increasing Subsequence
最长上升子序列,英文全程为Longest Increasing Subsequence,简称LIS,这个问题是一个经典的动态规划问题。
先来介绍一下最长上升子序列的定义,设有n个数,a1,a2,a3,... ,an,如果ai1<ai2<...<aik,其中1<=i1<i2<i3<...<ik<=n,那么ai1,ai2,...,aik,就是这n个数的上升子序列,所有的上升子序列中,最长的那个叫做最长上升子序列,显然,最长上升子序列可能不止一个,就是说可能存在多个上升序列,它们的长度相等,并且是最长的。
求解这个问题有两种算法,复杂分别是n^2和nlogn,但基本的思想都是动态规划,不同的是,第二中方法利用了二分的思想,将复杂度降到了nlogn。
解法一(n^2算法):
我们用一维的数组表示状态,即dp[i]表示以第i个数结尾的最长上升子序列的最长长度,那么很容易推出状态转移方程dp[i] = max(dp[j]+1),其中1<=j<i,并且aj<ai。
这个算法比较容易理解,我们还能在求的过程中记录下来这个最长上升子序列。
另一个思路是:
对序列X进行排序得到X’, 然后求X和X’的最长公共子序列就得到了该序列的最长单调递增子序列.这个方法也是n^2的.
代码如下:
/*************************************************************************
> File Name: lis_n2.cpp
> Author: gwq
> Mail: gwq5210@qq.com
> Created Time: 2014年10月30日 星期四 16时42分25秒
************************************************************************/
#include <cmath>
#include <ctime>
#include <cctype>
#include <climits>
#include <cstdio>
#include <cstdlib>
#include <cstring>
#include <map>
#include <set>
#include <queue>
#include <stack>
#include <vector>
#include <sstream>
#include <iostream>
#include <algorithm>
#define INF (INT_MAX / 10)
#define clr(arr, val) memset(arr, val, sizeof(arr))
#define pb push_back
#define sz(a) ((int)(a).size())
using namespace std;
typedef set<int> si;
typedef vector<int> vi;
typedef map<int, int> mii;
typedef long long ll;
const double esp = 1e-5;
#define N 10010
int num[N], dp[N], pre[N];
int main(int argc, char *argv[])
{
int n;
while (scanf("%d", &n) != EOF) {
for (int i = 0; i < n; ++i) {
scanf("%d", &num[i]);
}
//初始化,以第i个数为终点的最长上升序列长度为1
//其前驱为-1,即没有前驱
for (int i = 0; i < n; ++i) {
dp[i] = 1;
pre[i] = -1;
}
for (int i = 1; i < n; ++i) {
//找到最优解,并记录前驱节点
for (int j = 0; j < i; ++j) {
if (num[j] < num[i] && dp[i] < dp[j] + 1) {
dp[i] = dp[j] + 1;
pre[i] = j;
}
}
}
int pos = 0;
int max = 0;
for (int i = 0; i < n; ++i) {
if (max < dp[i]) {
max = dp[i];
pos = i;
}
}
//记录的是逆序的,所以要倒序输出
int u = pos;
stack<int> s;
while (u != -1) {
s.push(num[u]);
u = pre[u];
}
printf("%d\n", max);
for (int i = 0; i < max; ++i) {
printf("%d%c", s.top(), (i == max - 1) ? '\n' : ' ');
s.pop();
}
}
return 0;
}
解法二(nlogn):
上述算法已经能很好的解决最长上升子序列的问题了,但是,效率是n^2,不尽如人意,所以,就有了这个改进的nlogn算法,原理是引入了二分思想,即在前i-1个数里查找最优解的时候,经过特殊处理,使得能满足二分查找的性质。
首先考虑一种情况,如果dp[i]==d[j],但是num[i]<num[j],那么我们选择那个好呢,显然,选择以num[i]为结尾的序列更优潜力,因为可能存在一个k,使得num[i] < num[k] < num[j],可以使以num[i]为结尾的序列变长,但却不能使以num[j]为结尾的序列边长。那么我们如果知道长度为i的所有序列中结尾数字最小的那个数,就可以知道能否得到一个更长的序列,设用d[i]表示长度为i的序列结尾的最小数字,那么我们就可以维护这个数组,来求得最长公共子序列的长度。
首先,数组d有两个性质,第一,对于数组中的某个元素,如d[k],d[k]在更新的过程中不可能增大;第二,对于整个数组d,这个数组是严格递增的,这个也很容易理解,子序列长度为i+1的结尾的数字至少要比子序列长度为i的结尾的数字大,否则,就构不成长度为i+1的序列。
有了这两个性质,我们就可以用二分法来更新这个数组,具体方法是,初始,最长公共子序列的长度len为1,d[1] = num[1],每读入一个元素num[i],如果d[len] < num[i],那么令d[++len] = num[i],否则,二分找到pos,使得d[pos - 1] < num[i]并且num[i] <= d[pos],然后,将d[pos]赋值为num[i]。
代码如下:
/*************************************************************************
> File Name: lis_nlogn.cpp
> Author: gwq
> Mail: gwq5210@qq.com
> Created Time: 2014年10月30日 星期四 16时42分25秒
************************************************************************/
#include <cmath>
#include <ctime>
#include <cctype>
#include <climits>
#include <cstdio>
#include <cstdlib>
#include <cstring>
#include <map>
#include <set>
#include <queue>
#include <stack>
#include <vector>
#include <sstream>
#include <iostream>
#include <algorithm>
#define INF (INT_MAX / 10)
#define clr(arr, val) memset(arr, val, sizeof(arr))
#define pb push_back
#define sz(a) ((int)(a).size())
using namespace std;
typedef set<int> si;
typedef vector<int> vi;
typedef map<int, int> mii;
typedef long long ll;
const double esp = 1e-5;
#define N 10010
int num[N], d[N], len;
int find(int idx)
{
int l = 1;
int r = len - 1;
//二分找到更新的位置
while (l <= r) {
int mid = (l + r) >> 1;
if (num[idx] > d[mid] && num[idx] <= d[mid + 1]) {
return mid + 1;
} else if (num[idx] > d[mid]) {
l = mid + 1;
} else {
r = mid - 1;
}
}
//找不到,就更新d[1],这个一定是长度为1的最小的
//否则,就到不了这一步了
return 1;
}
int main(int argc, char *argv[])
{
int n;
while (scanf("%d", &n) != EOF) {
for (int i = 0; i < n; ++i) {
scanf("%d", &num[i]);
}
len = 1;
d[1] = num[0];
for (int i = 1; i < n; ++i) {
if (d[len] < num[i]) {
d[++len] = num[i];
} else {
int pos = find(i);
d[pos] = num[i];
}
}
printf("%d\n", len);
}
return 0;
}
上述两种算法各有优点,第一种可以记录得到的最长子序列,第二种算法就记录不了,但是效率得到了提升。