最长上升子序列 LIS (Longest Increasing Subsequence)

最新推荐文章于 2024-08-12 12:58:38 发布

gotojava9

最新推荐文章于 2024-08-12 12:58:38 发布

阅读量1k

点赞数 1

分类专栏：经典问题文章标签： LIS 线段树

本文链接：https://blog.csdn.net/gotojava9/article/details/50579811

版权

经典问题专栏收录该内容

3 篇文章 0 订阅

订阅专栏

已知一个有N个数的数列 $a_0, a_1, ..., a_{N-1}$ ，求该数列的一个子序列 $a'_0, a'_1, ..., a'_{M-1}$ ，使 $a'_0≤a'_1≤ ...≤ a'_{M-1}$ ，且M尽量大。注意：子序列意思是 $a'_i, a'_{i+1}$ 映射到 $a$ 的编号不一定连续，但相对位置不变。
【输入】N，数列 $a$ .
【输出】M

一、 $O(N^2)$ ：动态规划

在逐个加入元素的角度考虑，先假设已经加入了 $a_0, a_1, ..., a_{i-1}$ ，形成了一些上升子序列。现在要加入 $a_i$ 。
那么，很明显可以想到一个算法：将 $a_i$ 连到一个结尾元素比它小的上升子序列后面，如果有多个，连到最长的一个后面。
用 $f[i]$ 表示结尾元素编号是 $i$ 的LIS的长度，那么有两种情况：
- $a_i$ 比 $a$ 前面任何一个元素都小，此时 $f[i]=1$ ；
- $a_i$ 比前面的一些元素（或全部元素）大，此时 $a_i$ 应该连接到以这些元素结尾的子序列中最长者的结尾，并且该子序列长度+1，即 $f[i]=\max(f[j]|j<i)+1$
于是得状态转移方程：

f [i] = max (0, f [j] | j < i) + 1

$f[i]=\max(0, f[j]|j<i)+1$
所以它本质上就是动态规划。

f[0] = 1;
for (int i=1; i<N; i++)
{
    f[i] = 1;
    for (int j=0; j<i; j++)
        if (a[j]<a[i])
            f[i] = max(f[i], f[j]+1);
    LIS_len = max(LIS_len, f[i]);
}

二、 $O(N \log N)$ ：动态规划+RMQ

上面的DP程序比较影响速度的就是这一段：

for (int j=0; j<i; j++)
    if (a[j]<a[i])
        f[i] = max(f[i], f[j]+1);

让我们回到前面的状态转移方程，可以看到，关键在于求f[0]~f[i-1]的最大值，也就是RMQ！

三、 $O(N \log N)$ ：单调性+二分查找

其实，f[i]除了表示结尾元素编号是 $i$ 的LIS长度，还可以从另一种角度看。下面介绍的这种算法中， $f[i]$ 表示的是长度为 $\mathbf i$ 的LIS的最小结尾元素编号。这种算法没有用前一种算法那么好理解，为什么f[i]记录最小结尾元素和为什么数组能保持单调性是两个难点。
我们期望在前i个元素中的所有长度为len的递增子序列中找到这样一个序列，它的末尾元素比 $a_i$ 小，而且长度要尽量的长，如此，我们只需记录len长度的递增子序列中最大元素的最小值就能使得将来的递增子序列尽量地长。
举个例子，还是在逐个加入元素的角度考虑，在加入 $a_i$ 时，之前有两个LIS，长度一致，但是结尾元素一个是10，一个是30。如果 $a_i≤10$ ，那两个都不能加；如果 $a_i>30$ ，两个LIS加哪个也无所谓。但如果 $10<a_i≤30$ ，那么很明显只能选结尾元素是10的LIS。要是再来一个长度相同的LIS，结尾元素是5，很明显选它是更优的。
上面这个例子说明在相同长度的前提下，LIS的结尾元素越小越好。因此，用 $i$ 表示LIS的长度， $f[i]$ 表示最小结尾元素方便了后面元素的查询。每加入一个元素，查询符合的LIS，再更新，使得数组的单调性不会影响，因为较长的上升子序列是由较短的上升子序列连接元素组成，比如，当 $f[3]=5$ 时，只要有长度为4的LIS，必定有 $f[4]>5$ ，因为这个LIS的第3个元素至少是5，因而它的第四个元素必然大于5。

C++的 < algorithm > 库里就有两个二分搜索的函数，因此它的C++代码很短，很方便写。
lower_bound(first,last,val) 函数返回一个非递减序列[first, last)（包含 first 不包含 last）中的第一个大于等于值val的位置。first 与 last 均为指针类型，使用时类似 sort，下同。
upper_bound(first,last,val) 函数返回一个非递减序列[first, last)中第一个大于val的位置。
这两个函数的时间复杂度都是 $O(\log N)$ 。

f[0]=-oo; f[1] = a[0];
for (int i=2; i<N; i++) f[i]=oo;
int ans=1;
for (int i=1; i<N; i++)
{
    int* p = lower_bound(f,f+ans+2,a[i]);
    if (a[i] < *p) *p = a[i];
    if (f[ans+1] < oo) ans++;
}