主席树
三类经典应用:
- 区间Mex
- 区间种类数
- 区间第K大
一.区间Mex
- 题目链接: https://www.luogu.com.cn/problem/P4137
- 解题思路: 对于主席树,我们维护一颗权值线段树,并且用来记录每一个数最后出现的位置。为什么这样做呢?例如现在有序列 [ 3 , 1 , 0 , 2 , ? , ? ] [3,1,0,2,?,?] [3,1,0,2,?,?],那么对于主席数来说我们维护 [ 1 , 4 ] [1,4] [1,4]的序列,主席树内容为 [ 3 , 2 , 4 , 1 , 0 , 0 ] [3,2,4,1,0,0] [3,2,4,1,0,0],那么如果我们查询 M e x ( 2 , 4 ) Mex(2,4) Mex(2,4),也就是说我们需要快速在序列中找到一个小于2的数并且下标最小,并且最后的下标就是答案,显然下标为 3 3 3的数为1满足小于2,那么最后答案就是3。对于这个寻找过程,我们只需要维护一个区间 M i n [ X ] Min[X] Min[X]表示区间 X [ L , R ] X[L,R] X[L,R]最后一次修改的最小位置。 [ L , R ] [L,R] [L,R]即为答案区间,若 [ L , R ] [L,R] [L,R]中最小的那个位置小于询问的 l l l,则答案可能在 [ L , R ] [L,R] [L,R]内由于答案具有单调性,于是我们在主席树上二分就可以找到最终解了,如果看不懂,模拟一下代码过程也大致能明白
const int N = 2e5 + 5;
int n , m;
int a[N], lst[N], tot;
int rt[N<<5], lc[N<<5], rc[N<<5], minn[N<<5];
int insert (int pre, int l , int r, int k ,int val)
{
int now = ++ tot;
lc[now] = lc[pre];
rc[now] = rc[pre];
if (l == r)
{
minn[now] = val;
return now;
}
int mid = (l + r) >> 1;
if (k <= mid)
lc[now] = insert (lc[pre], l, mid, k , val);
else
rc[now] = insert (rc[pre], mid + 1, r, k, val);
minn[now] = min (minn[lc[now]], minn[rc[now]]);
return now;
}
int query (int i, int l, int r, int val)
{
if (l == r)
return l;
int mid = (l + r) >> 1;
if (minn[lc[i]] < val)
return query (lc[i], l, mid, val);
else
return query (rc[i], mid + 1, r, val);
}
int main (void)
{
CLOSE;
cin >> n >> m;
for (int i = 1 ; i <= n ; i ++)
{
cin >> a[i];
if (a[i] > n)
a[i] = n + 1;
}
int len = n + 1;
rt[0] = 0;
for (int i = 1 ; i <= n ; i ++)
rt[i] = insert (rt[i-1], 0, len, a[i], i);
while (m --)
{
int l, r;
cin >> l >> r;
cout << query(rt[r], 0, len, l) << endl;
}
}
二.区间种类数
- 题目链接: https://www.luogu.com.cn/problem/P1972
- 解题思路: 本题和上一个题的做法类似,都是要考虑最后一个数出现的位置,只不过这里是将位置标记为 0 o r 1 0or1 0or1,举个例子就明白了 。现在假设有序列 [ 3 , 5 , 3 , 7 , 6 ] [3,5,3,7,6] [3,5,3,7,6] 询问你 T y p e ( 1 , 5 ) Type(1,5) Type(1,5) 那么对于主席树我们维护了5个前缀序列 [ 1 , 0 , 0 , 0 , 0 ] , [ 1 , 1 , 0 , 0 , 0 ] , [ 0 , 1 , 1 , 0 , 0 ] , [ 0 , 1 , 1 , 1 , 0 ] , [ 0 , 1 , 1 , 1 , 1 ] [1,0,0,0,0],[1,1,0,0,0],[0,1,1,0,0],[0,1,1,1,0],[0,1,1,1,1] [1,0,0,0,0],[1,1,0,0,0],[0,1,1,0,0],[0,1,1,1,0],[0,1,1,1,1],显然我们求一下第五个序列的区间和就是答案了。这里的主席树维护的并不是值域桶而是下标桶 (如果维护值域桶,那么直接对序列做差时间复杂度会出现问题,因为你做差后得到的新序列大于1的数需要作为1计算,这个地方需要遍历[l,r],和暴力就没有区别了).至于上面描述过程如何实现,看代码模拟一下就知道了。
const int N = 1e6 + 5;
int n, m;
int a[N], last[N], tot;
int rt[N << 5] , lc[N << 5], rc[N << 5], sum[N << 5];
int insert (int pre ,int l , int r, int k , int val)
{
int now = ++ tot;
lc[now] = lc[pre];
rc[now] = rc[pre];
if (l == r)
{
sum[now] += val;
return now;
}
int mid = (l + r) >> 1;
if (k <= mid)
lc[now] = insert (lc[pre], l, mid, k , val);
if (k > mid)
rc[now] = insert (rc[pre], mid + 1, r, k , val);
sum[now] = sum[lc[now]] + sum[rc[now]];
return now;
}
int query (int i , int l , int r, int L , int R)
{
int ans = 0;
if (l >= L && r <= R)
return sum[i];
int mid = (l + r) >> 1;
if (L <= mid)
ans += query (lc[i] , l , mid, L, R);
if (R > mid)
ans += query (rc[i] , mid + 1, r, L ,R);
return ans;
}
int main (void)
{
CLOSE;
cin >> n;
rt[0] = 0;
for (int i = 1 ; i <= n ; i ++)
{
cin >> a[i];
if (!last[a[i]])
rt[i] = insert (rt[i-1],1 , n, i, 1);
else
{
int t = insert (rt[i-1], 1, n, last[a[i]], 0);
rt[i] = insert (t, 1, n, i, 1);
}
last[a[i]] = i;
}
cin >> m;
while (m --)
{
int l , r;
cin >> l >> r;
cout << query (rt[r], 1, n , l , r) << endl;
}
}