前言:这是一篇笔者两年前所写的博客。如今,在线段树在脑海中即将遗忘之际,这两年前留下的文章,终于将其再次唤醒。这篇文章对于线段树的理解虽谈不上绝对深刻,但是也能详细且简明地解释其流程。因而也收获了3w+的阅读量。今日,我也将原先的博客的语言以及配图进行了一定优化,希望能对各位读者有所帮助。
“线段树是什么?线段树怎么写?”
如果你在考提高组前一天还在问这个问题,那么你会与一等奖失之交臂;如果你还在冲击普及组一等奖,那么这篇文章会浪费你人生中宝贵的5~20分钟。
上面两句话显而易见,线段树这个数据结构是一个从萌新到正式OI选手的过渡,是一个非常重要的算法,也是一个对于萌新来说较难的算法。不得不说,我学习了这个算法5遍左右才有勇气写的这篇博客。
但是,对于OI正式选手来说,线段树不是算法,应该是一种工具。她能把一些对于区间(或者线段)的修改、维护,从O(N)的时间复杂度变成O(logN)。
废话不说,这篇博客会分为四部:
第一部:线段树概念引入
第二部:简单(无pushdown)的线段树
第三部:区间+/-修改与查询
第四部:区间乘除修改与查询
总结与算法模板
第一部 概念引入
线段树是一种二叉树,也就是对于一个线段,我们会用一个二叉树来表示。比如说一个长度为4的线段,我们可以表示成这样:
这是什么意思呢?如果你要表示线段的和,那么最上面的根节点的权值表示的是这个线段1~4的和。根的两个儿子分别表示这个线段中1~2的和,与3~4的和。以此类推。
然后我们还可以的到一个性质:节点i的权值=她的左儿子权值+她的右儿子权值。因为1~4的和就是等于1~2的和+2~3的和。
根据这个思路,我们就可以建树了,我们设一个结构体tree,tree[i].l和tree[i].r分别表示这个点代表的线段的左右下标,tree[i].sum表示这个节点表示的线段和。
我们知道,一颗二叉树,她的左儿子和右儿子编号分别是她*2和她*2+1
再根据刚才的性质,得到式子:tree[i].sum=tree[i*2].sum+tree[i*2+1].sum;就可以建一颗线段树了!代码如下:
inline void build(int i,int l,int r){
//递归建树 tree[i].l=l;tree[i].r=r; if(l==r){
//如果这个节点是叶子节点 tree[i].sum=input[l]; return ; } int mid=(l+r)>>1; build(i*2,l,mid);//分别构造左子树和右子树 build(i*2+1,mid+1,r); tree[i].sum=tree[i*2].sum+tree[i*2+1].sum;//刚才我们发现的性质return ;}
嗯,这就是线段树的构建,你可能会问为什么要开好几倍的内存去储存一条线段。这是因为我们还没有让这个过大的数组干一些实事,那么什么是实事呢?让我们进入下一部(在你看懂这一部的情况下)
第二部 简单(无pushdown)的线段树
1、单点修改,区间查询
其实这一章开始才是真正的线段树,我们要用线段树干什么?答案是维护一个线段(或者区间),比如你想求出一个1~100区间中,4~67这些元素的和,你会怎么做?朴素的做法是for(i=4;i<=67;i++) sum+=a[i],这样固然好,但是算得太慢了。
我们想一种新的方法,先想一个比较好画图的数据,比如一个长度为4的区间,分别是1、2、3、4,我们想求出第1~3项的和。按照上一部说的,我们要建出一颗线段树,其中点权(也就是红色)表示和:
然后我们要求1~3的和,我们先从根节点开始查询,发现她的左儿子1~2这个区间和答案区间1~3有交集,那么我们跑到左儿子这个区间。
然后,我们发现这个区间1~2被完全包括在答案区间1~3这个区间里面,那就把她的值3返回。
我们回到了1~4区间,发现她的右儿子3~4区间和答案区间1~3有交集,那么我们走到3~4区间
到了3~4区间,我们发现她并没有完全包含在答案区间1~3里面,但发现她的左儿子3~3区间和1~3区间又交集,那么久走到3~3区间
到了3~3区间,发现其被答案区间完全包含,就返回她的值3一直到最开始
3~3区间的3+1~2区间的3=6,我们知道了1~3区间和为6.
有人可能会说你这样是不是疯了,我那脚都能算出1+2+3=6,为什么这么麻烦?!
因为这才几个数,如果一百万个数,这样时间会大大增快。
我们总结一下,线段树的查询方法:
1、如果这个区间被完全包括在目标区间里面,直接返回这个区间的值
2、如果这个区间的左儿子和目标区间有交集,那么搜索左儿子
3、如果这个区间的右儿子和目标区间有交集,那么搜索右儿子
写成代码,就会变成这样:
inline int search(int i,int l,int r){
if(tree[i].l>=l && tree[i].r<=r)//如果这个区间被完全包括在目标区间里面,直接返回这个区间的值 return tree[i].sum; if(tree[i].rr) return 0;//如果这个区间和目标区间毫不相干,返回0 int s=0; if(tree[i*2].r>=l) s+=search(i*2,l,r);//如果这个区间的左儿子和目标区间又交集,那么搜索左儿子 if(tree[i*2+1].l<=r) s+=search(i*2+1,l,r);//如果这个区间的右儿子和目标区间又交集,那么搜索右儿子 return s;}
关于那几个if的条件一定要看清楚,最好背下来,以防考场上推错。
然后,我们怎么修改这个区间的单点,其实这个相对简单很多,你要把区间的第dis位加上k。
那么你从根节点开始,看这个dis是在左儿子还是在右儿子,在哪往哪跑,
然后返回的时候,还是按照tree[i].sum=tree[i*2].sum+tree[i*2+1].sum的原则,更新所有路过的点
如图所示,其中深蓝色是去的路径,浅蓝色是返回的路径,回来时候红色的+标记就是把这个点加上这个值。
把这个过程变成代码,就是这个样子:
inline void add(int i,int dis,int k){
if(tree[i].l==tree[i].r){
//如果是叶子节点,那么说明找到了 tree[i].sum+=k; return ; } if(dis<=tree[i*2].r) add(i*2,dis,k);//在哪往哪跑 else add(i*2+1,dis,k); tree[i].sum=tree[i*2].sum+tree[i*2+1].sum;//返回更新 return ;}
2、区间修改,单点查询
区间修改和单点查询,我们的思路就变为:如果把这个区间加上k,相当于把这个区间涂上一个k的标记,然后单点查询的时候,就从上跑道下,把沿路的标记加起来就好。
这里面给区间贴标记的方式与上面的区间查找类似,原则还是那三条,只不过第一条:如果这个区间被完全包括在目标区间里面,直接返回这个区间的值变为了如果这个区间如果这个区间被完全包括在目标区间里面,讲这个区间标记k
具体做法很像,这里贴上代码: