【学习笔记】替罪羊树

0.链接

以往我都是把链接放在最后面的。后来我想了想,这样是不道德的,欺骗读者先看自己的垃圾文章,再看真正带劲的博客!

所以,真正带劲的博客在这里了,是一篇洛谷的博客。

1.概述

然而还是一种二叉平衡树……好处是不用旋转。

2.思想

2.1.保持平衡

众所周知,时间复杂度得靠平衡来保证。如果你不旋转,为什么能够保持平衡呢?

我们来看另一个例子,时间复杂度非常稳定,算法的流程是——

  • 请注意,这不是要介绍新算法,尽管它的复杂度是很有保障的,而且代码复杂度极低。但是!你即使学到了这种算法,也要坚持把这篇博客讲述的 替罪羊树 看完,因为技多不压身。
  • 请注意,学完之后,你不要忘记最初点进这篇博客的原因,因为你知道,这篇博客说不定有点帮助呢?所谓兼听则明、偏听则暗,永远不要只看一家之言,最好是博览群书,却不尽信书。
  • 请注意,这是一种不需要使用二叉平衡树的算法,不然,我们把它作为“二叉平衡树之替罪羊”的引路人有什么意义?但这也意味着,你得更用心地寻找这种方法蕴含的思想与今天的 替罪羊树 有什么关系。
  • 请注意,我写这么多条是希望你认真思考如何让复杂度稳定下来,同时也是为了让你的情绪稳定下来。人不要总是充满好奇心,对自己仿佛从来没听说过的算法而兴奋。

——利用数组存储,插入排序,二分查找。

认错是不可能认错的。我错了,我真的错了。

好吧,进入正题:如果我们 暴力地将树重构为平衡的样子,它不就平衡了吗?就像那个小小的数组,每次都进行一次插入排序,使其有序(或者赋予其特殊结构、性质),所以可以 加快查询的速度

然后就有了 替罪羊树 ,尽管你看不出这跟 替罪羊 有什么关系。

2.2.平衡因子

很显然,上面用数组实现的例子中,因为每一次都调整结构,所以很慢

那么,放在 替罪羊树 上,我们需要对其进行改进,我们 减少重构的次数

但是,别忘了,重构是必要的,否则树将会不平衡。为了在 平衡和重构次数之间找到平衡,我们定义了一个非常有意思的常数:平衡因子 α \alpha α

我们只对 严重倾斜 的子树进行重构。其中,严重倾斜 的定义是:

∃ y ∈ s o n ( x ) ,    s i z e ( y ) > α ⋅ s i z e ( x ) \exist y\in son(x),\;size(y)>\alpha\cdot size(x) yson(x),size(y)>αsize(x)

很科学,不是吗?如果这颗子树的 α \alpha α 都在某个儿子中,那就不是很平衡了。

一般来说,我们取 α ∈ [ 0.7 , 1 ) \alpha\in[0.7,1) α[0.7,1) ,具体取决于使用场景。别忘了,重构的目的是加快查询,重构次数太多会使得插入极其缓慢。找到 b a l a n c e balance balance 即可!

2.3.惰性修改

一般的二叉平衡树,删除的时候就会直接将节点移除。但是,替罪羊树 非常讨厌结构的变化

所以,我们把那些 c n t = 0 cnt=0 cnt=0 的节点给保留下来,以维持原有的结构。以后,某一次插入的时候,如果导致子树被重构,再把这些点剔除。

内在的道理是什么呢?我的理解是,替罪羊树 结构很完美(有如线段树),所以不需要对其结构进行修改。而其他的平衡树,都是 节点数量越少,速度越快,自然就这样了呗。

3.代码

直接到 代码 板块了吗?这么快?

但是也确实没有什么可以讲的了 😐

难道 开两个数组,一个存 节点 的数量,另一个存 元素 的数量 是需要专门拿出来说的吗?

难道 重构的时候,可以只重构最大的不平衡子树 也是值得一提的吗?

#include <cstdio>
#include <iostream>
#include <vector>
#include <cstdlib>
#include <algorithm>
using namespace std;
inline int readint() {
	int a = 0; char c = getchar(), f = 1;
	for(; c<'0' or c>'9'; c=getchar())
		if(c == '-') f = -f;
	for(; '0'<=c and c<='9'; c=getchar())
		a = (a<<3)+(a<<1)+(c^48);
	return a*f;
}
# define MB template < typename T >
MB void getMax(T &a,const T &b){ if(a < b) a = b; }
MB void getMin(T &a,const T &b){ if(b < a) a = b; }

const int MaxN = 300005;

namespace SGT{ // ScapeGoatTree
	int siz[MaxN]; // 节点数量
	int data[MaxN]; // 元素大小
	int cnt[MaxN]; // 元素数量
	int alive[MaxN]; // 元素总数量
	int son[MaxN][2]; // 儿砸
	const double alpha = 0.72; // 平衡因子
	bool bad(int o){ // 不平衡了!
		if(siz[son[o][0]] > alpha*siz[o])
			return true;
		if(siz[son[o][1]] > alpha*siz[o])
			return true;
		return false;
	}
	void pushUp(int o){
		siz[o] = 1+siz[son[o][0]]+siz[son[o][1]];
		alive[o] = alive[son[o][0]]+alive[son[o][1]];
		alive[o] += cnt[o]; // 还活着几个
	}
	int cntNode;
	int newNode(int val,int num){
		if(num <= 0) return 0;
		int &id = ++ cntNode;
		data[id] = val, siz[id] = 1;
		cnt[id] = alive[id] = num;
		return id;
	}
	int build(vector<int> &v,int l,int r){
		if(l == r) return 0; // [l,r)
		int mid = (l+r)>>1, o = v[mid];
		son[o][0] = build(v,l,mid);
		son[o][1] = build(v,mid+1,r);
		pushUp(o); return o;
	}
	void collect(vector<int> &v,int o){ // 收集子树内元素
		if(o == 0) return ;
		collect(v,son[o][0]);
		if(cnt[o] != 0) // 还活着
			v.push_back(o);
		collect(v,son[o][1]);
	}
	void rebuild(int &o){
		static vector<int> v; v.clear();
		collect(v,o), o = build(v,0,v.size());
	}
	void modify(int &o,int val,int addv,int &re){
		if(o == 0) return void(o = newNode(val,addv));
		if(data[o] == val) getMax(cnt[o]+=addv,0);
		else modify(son[o][data[o]<val],val,addv,re);
		pushUp(o); if(bad(o)) re = o;
	}
	void adjust(int o,int val,int re){
		while(re != 0){
			int d = (data[o] < val);
			if(re == son[o][d])
				rebuild(son[o][d]), re = 0;
			else o = son[o][d];
		}
	}
	int root;
	void modify(int val,int addv){
		int o = 0; modify(root,val,addv,o);
		if(o == root) rebuild(root);
		else adjust(root,val,o);
	}
	int getRank(int val){
		int o = root, res = 0;
		for(int d; o!=0; o=son[o][d]){
			d = data[o] <= val;
			res += d*(alive[son[o][0]]);
			if(data[o] == val) break;
			else res += d*cnt[o];
		}
		return res;
	}
	int count(int val){
		int o = root;
		for(int d; o!=0; o=son[o][d]){
			d = data[o] < val;
			if(data[o] == val) break;
		}
		return cnt[o];
	}
	int kthElement(int k){
		int o = root;
		for(int d; o!=0; d=0){
			d = alive[son[o][0]]+cnt[o];
			if(k >= alive[son[o][0]]){
				if(k < d) return data[o];
				k -= d, o = son[o][1];
			}
			else o = son[o][0];
		}
		return 0.0/0.0; // 还你一个 NaN
	}
} using namespace SGT;

int main(){
	for(int T=readint(),opt,x; T; --T){
		opt = readint(), x = readint();
		if(opt == 1 or opt == 2)
			modify(x,-2*opt+3);
		if(opt == 3) printf("%d\n",getRank(x)+1);
		if(opt == 4) printf("%d\n",kthElement(x-1));
		if(opt == 5 or opt == 6){
			int rnk = getRank(x), d = -1;
			if(opt == 6) d = count(x);
			printf("%d\n",kthElement(rnk+d));
		}
	}
	return 0;
}

4.时间复杂度

知乎里写的挺好的。真正的理性思维。

如何感性理解复杂度呢?对于一个大小为 x x x 的子树,如果它需要重构,那么两个子树的大小之差至少达到 ( 2 α − 1 ) x (2\alpha-1)x (2α1)x 。也就是说,如果平衡后要再次激发重构,复杂度花费是 x x x,但是这也需要一个正比于 x x x 的插入次数。而替罪羊是严格树高 O ( log ⁡ n ) \mathcal O(\log n) O(logn) 的,即每次插入只能提供 O ( log ⁡ n ) \mathcal O(\log n) O(logn) 个子树的 “插入”,所以总复杂度还是均摊 O ( log ⁡ n ) \mathcal O(\log n) O(logn) 的。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值