主席树学习笔记 讲解

引言

主席树是线段树的升级版,学主席树之前先把线段树弄会,线段树讲解参见-->>传送门

主席树可以解决  求区间不同数的个数、静态区间第k大 等经典问题。

主席树记录了构建线段树的每个步骤,可以理解为多个线段树的压缩版(公用相同的节点)。

数据结构

对于一棵空线段树,按顺序依次将一个数列加入,如果我们需要在添加的过程中每一个步骤的线段树,且强制在线的话(比如已经添加了第10个值,却需要前6个值求区间和的时候),一棵线段树就无法满足要求。

我们可以考虑每添加一个点,都将原来的线段树复制一遍,在新树上进行修改,这样就保留了过程中每一个中间步骤。

但是这样会浪费大量的时间和空间。我们发现,线段树更新一个叶子的时候,只修改了从根节点到当前叶子这条路上的logn个节点。其余的分叉根本没有被改变,理论上讲也就不需要将其他没有改变的节点备份。

主席树就是根据这个思路压缩空间和时间的。

见下图:

(图来源于殇雪

左侧是一棵线段树,要改变叶子7时,只需要将被改变的一条链做修改拷贝,其余没有改变的节点依然共用之前的值,这样每次更新叶子只需要付出logn的时间和空间。全部更新完毕后,我们就得到了n+1棵线段树,时间空间复杂度仅为nlogn。

基本操作

来自kuangbin板子(区间不同数字个数)

建立:

主席树的建立仅仅是建立一棵空的线段树用于初始化。

#include<bits/stdc++.h>
using namespace std;
int const maxn=1e5+5;
int const maxRoot=maxn*100;//开四倍的空间应该就够了吧 为啥要开100
int n,q; 
int tot=0;//分配空间 
int a[maxn];//存放原始数据 
int T[maxn];//根 
int lson[maxRoot];//左孩子索引 
int rson[maxRoot];//右孩子索引 
int c[maxRoot]; //节点值 
int build(int l,int r){
    //建立空白线段树 l和r表示当前节点应当表示的区间范围 
    int root=tot++;//申请空间 
    c[root]=0;    //节点置为0 
    if(l!=r){
        int mid=(l+r)>>1;
        lson[root]=build(l,mid);//递归建立左树,跟线段树一样 
        rson[root]=build(mid+1,r);//建立右树 
    }
    return root;
}

更新

建立logn个节点,并索引至上一个状态的节点

int update(int root,int pos,int add){  //更新叶子,参数:最后一个根节点、更新位置、增加的值
    int newroot=tot++;  //申请空间 增加新的根  newroot为工作指针,感觉这里变量名起反了 
    temp=newroot;  //新的根备份下来用作返回值 
    c[newroot]=c[root]+add;  //因为是给叶子增加一个值,所以路径每个节点都增加一个值,不用PushUp()来更新了。 
    int l=1,r=n;  //根节点表示的范围是1~n 
    while(l<r){
        int mid=(l+r)>>1;
        if(pos<=mid){
                //叶子位置在左子树,所以左子树新建链,右子树继承 newroot是新树节点,root是旧树节点 
                //参照上面的图 
            lson[newroot]=tot++;   //左子树新建链
            rson[newroot]=rson[root];  //右子树继承旧的
            newroot=lson[newroot];  //继续向下建树,因为右子树已经继承了所以只建左子树就可以了
            root=lson[root];  //因为要建新树的左链,所以只用参照旧树的左链。 

            r=mid;
        }
        else{
              //叶子的位置在右子树 
            rson[newroot]=tot++;  //右子树重建链 
            lson[newroot]=lson[root];  //左子树继承
            newroot=rson[newroot];  //因为左子树已经继承,所以只建右子树 
            root=rson[root];   //跟随新树 

            l=mid+1;
        } 
    } 
      //l==r 已经到达叶子 最后将叶子跟新值
    c[newroot]=c[root]+add; 
    return tmp;   //返回新树根 

查询

选择好要在哪棵树上查询,然后跟线段树完全相同的操作。

int query(int root,int pos){    //查询1到pos的区间和,参数:根节点(历史记录),查询位置 
    int ret=0;
    int l=1,r=n;
    while(pos<r){
        int mid=(l+r)>>1;
        if(pos<=mid){
            r=mid;
            root=lson[root];
        }
        else{
            ret+=c[lson[root]];
            root=rson[root];
            l=mid+1;
        }
    } 
    return ret+c[root];//最后加上叶子自己。 
}

完整代码(求区间不同数的个数)

(解释在后面)

#include<bits/stdc++.h>
using namespace std;
int const maxn=30010;
int const maxRoot=maxn*100;
int n,q; 
int tot=0;//分配空间 
int a[maxn];//存放原始数据 
int T[maxn];//根 
int lson[maxRoot];//左孩子索引 
int rson[maxRoot];//右孩子索引 
int c[maxRoot]; //节点值 
int build(int l,int r){
    //建立空白线段树 l和r表示当前节点应当表示的区间范围 
    int root=tot++;//申请空间 
    c[root]=0;    //节点置为0 
    if(l!=r){
        int mid=(l+r)>>1;
        lson[root]=build(l,mid);//递归建立左树,跟线段树一样 
        rson[root]=build(mid+1,r);//建立右树 
    }
    return root;
}
int update(int root,int pos,int add){  //更新叶子,参数:最后一个根节点、更新位置、增加的值
    int newroot=tot++;  //申请空间 增加新的根  newroot为工作指针,感觉这里变量名起反了 
    temp=newroot;  //新的根备份下来用作返回值 
    c[newroot]=c[root]+add;  //因为是给叶子增加一个值,所以路径每个节点都增加一个值,不用PushUp()来更新了。 
    int l=1,r=n;  //根节点表示的范围是1~n 
    while(l<r){
        int mid=(l+r)>>1;
        if(pos<=mid){
                //叶子位置在左子树,所以左子树新建链,右子树继承 newroot是新树节点,root是旧树节点 
                //参照上面的图 
            lson[newroot]=tot++;   //左子树新建链
            rson[newroot]=rson[root];  //右子树继承旧的
            newroot=lson[newroot];  //继续向下建树,因为右子树已经继承了所以只建左子树就可以了
            root=lson[root];  //因为要建新树的左链,所以只用参照旧树的左链。 

            r=mid;
        }
        else{
              //叶子的位置在右子树 
            rson[newroot]=tot++;  //右子树重建链 
            lson[newroot]=lson[root];  //左子树继承
            newroot=rson[newroot];  //因为左子树已经继承,所以只建右子树 
            root=rson[root];   //跟随新树 

            l=mid+1;
        } 

        c[newroot]=c[root]+add; 
    } 
    return tmp;   //返回新树根 

int query(int root,int pos){    //查询1到pos的区间和,参数:根节点(历史记录),查询位置 
    int ret=0;
    int l=1,r=n;
    while(pos<r){
        int mid=(l+r)>>1;
        if(pos<=mid){
            r=mid;
            root=lson[root];
        }
        else{
            ret+=c[lson[root]];
            root=rson[root];
            l=mid+1;
        }
    } 
    return ret+c[root];//最后加上叶子自己。 
}

int main(){
    while(scanf("%d",&n)==1){
        tot=0;
        for(int i=1;i<=n;i++){
            scanf("%d",&a[i]);
        }
        T[n+1]=build(1,n);  //将初始的线段树放到n+1的位置上
        map<int,int>mp;  //记录下每个值最靠左边出现的位置。 
        mp.clear();
        for(int i=n;i>=1;i--){  //倒着扫描数组, 
            if(mp.find(a[i]==mp.end())){   //如果数组后缀没出现过a[i]
                T[i]=update(T[i+1],i,1);   //没出现过那么i就是最后(倒着看,最靠左)出现的位置,就在i的位置上加1(置1) 
            }
            else{
                
                int tmp=update(T[i+1],mp[a[i],-1]);  //出现过了,就让a[i]之前最左的位置(上次出现的位置)加上-1(也就是置0了) 
                T[i]=update(tmp,i,1)   //将最新出现(最左)的位置加1 注意:两次update本来应该是建立两棵新树,

                                                                                                                                                     //但是丢掉了中间过程的树。
            } 
            mp[a[i]]=i;//更新最后出现的位置。 
        }
        /*
        上面的for循环中,重复的数字的位置,只有最左边的位置置1,其他位置加-1(也就是置0了) 
        */
        scanf("%d",&q);
        while(q--){
            int l,r;
            scanf("%d%d",&l,&r);
            printf("%d\n",query(T[l],r));
        } 
    }

 

解释一下为什么这么做就可以统计区间不同数的个数:
       我们倒着更新主席树,那么T[i]所在的树只有i到n的值更新了,左边的值还空着(为0)
而且主席树更新的时候重复数字只保留了最左端为1,其余均置0了,所以对区间求和就可以达到求不同数个数的目的 ,由于l之前的全为0,区间求和也就等价于取r的前缀和。

不需要的不更新的思想。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值