原题链接:
题解:
在之前我们对于最长上升子序列问题采用的是dp进行求解,时间复杂度是O(n^2)。
为了对其进行优化,这里采用贪心策略结合二分进行求解。
7
3 1 2 1 8 5 6
首先观察样例,对于8而言,其最长上升子序列的开始肯定是以1(下标为2处)为开始,而不是以3(下标为1处)为开始,因此没必要存储计算3处的最长上升子序列。
为了优化这个问题,我们不妨用一个vector数组记录长度为i的最长上升子序列末尾的最小值,例如对于长度为1的上升子序列,其末尾最小值当然是1而不是3。有了这个数组之后,对于新的元素,如果其大于vector数组末尾的元素(当前最长上升子序列末尾的最小值),那就将其加入到vector数组的末尾,相应的最长上升子序列的长度也加1。
如果其小于或等于vector数组末尾的元素,那就二分查找vector数组中第一个不小于当前新元素的元素,并用新元素替换。
疑惑点1:
最难理解的地方在于栈中序列虽然递增,但是每个元素在原串中对应的位置其实可能是乱的,那为什么这个栈还能用于计算最长子序列长度?
例如对于1,3,5,8,4这个序列而言,最后栈内的是1,3,4,8(可以看到在原始序列中4在8的后面,而在栈内却在栈的后面)
实际上这个栈【不用于记录最终的最长子序列】,而是【以stk[i]结尾的子串长度最长为i】或者说【长度为i的递增子串中,末尾元素最小的是stk[i]】。理解了这个问题以后就知道为什么新进来的元素要不就在末尾增加,要不就替代第一个大于等于它元素的位置。
这里的【替换】就蕴含了一个贪心的思想,对于同样长度的子串,我当然希望它的末端越小越好,这样以后我也有更多机会拓展。
疑惑点2:
为什么使用lower_bound(第一个大于等于当前元素)而不是使用upper_bound(第一个大于当前元素)呢?用lower_bound都相等了还要更新?
考虑这样一种情况:1、2、3、1、1。如果采用upper_bound,下标为4处的1会替换掉2,下标为5处的1会替换掉3。最后得到的结果是1、1、1。肯定是不对的,也即upper_bound只能维持单调不减,但是我们要求的是单调递增序列,因此需要使用lower_bound替换重复元素,得到1、2、3。
代码:
#include<bits/stdc++.h>
using namespace std;
const int N = 1e5 + 10;
int n, v[N];
vector<int> stk;
int main() {
cin >> n;
for (int i = 1;i <= n;i++) cin >> v[i];
stk.push_back(v[1]);
for (int i = 2;i <= n;i++) {
if (v[i] > stk.back()) stk.push_back(v[i]);
else *lower_bound(stk.begin(), stk.end(), v[i]) = v[i];
}
cout << stk.size();
}