写在最前面的
手贱翻开了《珠玑》的最后几章,所以这一篇更多是关于13、14、15章的内容。这篇文章的主要内容是“AVL树”,即平衡树,比红黑树低一个等次。捣乱真惹不起红黑树,情况很复杂;而AVL思路比较清晰。《编程珠玑,字字珠玑》910读书笔记——代码优化更新了,做了点关于“哨兵”的笔记。在这篇文章的末尾,笔者还加了对引用调用的“大彻大悟”。
4篇读书笔记:全在这里
AVL树
学习数据结构的时候,有过一次实验课, 题意大概:英文单词出现次数统计。当时选了哈希表,映射(map),AVL树(平衡树)三种方法来做,是冲着“完成实验老师请吃饭”去做的。哈希表键值用“除留余数法”,处理冲突用了最简单的开哈希表的“链地址法”。 映射(map)没有深入,只是简单的应用。 比较痛心的是AVL树。
AVL树的旋转
树的旋转分四种:左单旋,右单旋,左右旋转,右左旋转。规定,右子树的高度减去左子树的高度得到此节点的平衡数(也叫平衡因子,balance factor,bf),用bf(node)表示node节点的平衡数。小剖一下这四种情况:
当bf(node)==2的时候,即右子树高度比左子树高,需要将树在node节点左单旋。在作旋转之后,左子树bf+1,右子树bf-1,node节点平衡数归零。
节点的调整过程很清晰。
再来当bf(node)==-2时候,即右子树比左子树低。需要将树在node节点右单旋。在作选择之后,左子树bf-1,右子树+1,node节点平衡树归零。
细心的发现,左单旋和右单旋是一样的,只是反过来罢了。
下面的情况复杂了点,但是他们是从上面两种情况延伸过来的,但是这种变化导致它们平衡化的方法也有小小不同。 下面两种情况从子树的内侧插入,导致子树(bf(kid))和其父亲(bf(parent))的bf正负相反,先来左右旋转,看图:
解决之道:kid节点作简单的左单旋,然后parent作简单的右单旋。在过程中需要非常注意节点bf的调整,要分情况进行讨论(把这个槛跨过去,离成功就不远了)。
- 如果从左kid的右子树(grandkid)的左侧插入,
对bf(kid)调整:那么bf(grandkid)<0,在kid作了左单旋之后,grandkid的左侧树被调整为kid的右子树,结果bf(kid)=0;
对bf(parent)调整:在对parent作了右单旋之后,grandkid右子树被调整为parent的左子树,因此如果bf(grandkid)<0,那么bf(parent)=1;
- 如果从左kid的右子树(grandkid)的右侧插入,
对bf(kid)调整:那么bf(grandkid)>0,在kid作了左单旋之后,grandkid的左侧树被调整为kid的右子树,结果bf(kid)=-1;
对bf(parent)调整:在对parent作了右单旋之后,grandkid右子树被调整为parent的左子树,因此如果bf(grandkid)<0,那么bf(parent)=0; - 对bf(grandkid)调整:最后,grandkid被调整为新树的根节点,bf(grandkid)=0。
(作一个填空题吧) 结合下面的图来做,属于右左旋转:
对bf(grandkid)调整:最后,grandkid被调整为新树的根节点,bf(grandkid)= 。
答案:<,1,<,0;>,0,>,-1。
可以看出三个节点在调整过程中需要更改bf。最后一种旋转就是右左旋转。不需要太多的分析,跟上面的是一样的,做一个简单的反转。捣乱上图:
构造一个平衡树,即不断将一个新的节点在原树中找到合适的位置,然后调整。那么在“找”的过程中,所经历的节点bf都改变了(+1或者-1)。插入一个节点的做法是: 用栈存储所走过的节点,在找到插入位置后,从插入位置的父节点开始调整,如果此父节点是平衡的,那么从栈中取出父节点,继续调整。
从上面的分析中,只要旋转后,结果旋转的节点都会得到bf(node)=0结果,所以只要旋转后,我们的目的就达到了——树平衡了!所以bf(node)==0d的节点会越来越多,而且是堆积在树的顶层。
因此,不需要每次都调整到树的根节点root,只要调整的节点bf=0,就可以结束了,上面的节点或者兄弟节点已经bf=0。这我在刚接触AVL的时候也很迷惑的地方。
最后我把insert节点的代码给出:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
|
/***********************************
** sample
**********************************/
void
avl::insert(
int
data)
{
node * parent = 0,* p = root,* t =
new
node(data);
stack<node *> s;
while
(p)
{
int
ret = p->comp(*t);
if
(ret==0) {
delete
t;
return
;}
parent = p;s.push(parent);
if
(ret<0)
p = p->right;
else
p = p->left;
}
// while
p = t;
assert
(p);
if
(!root)
{
root = p;
return
;
}
// if
if
(parent->comp(*t)>0)
parent->left = p;
else
parent->right = p;
while
(!s.empty())
{
parent = s.top();
s.pop();
if
(p==parent->left) parent->bf--;
else
parent->bf++;
int
d;
if
(parent->bf==0)
break
;
if
(
abs
(parent->bf)==1) p=parent;
else
{
d = parent->bf<0?-1:1;
if
(d<0 && p->bf<0) r(parent);
else
if
(d>0 && p->bf>0) l(parent);
else
if
(d>0 && p->bf<0) rl(parent);
else
lr(parent);
break
;
}
// if
}
// while
if
(s.empty())
root = parent;
else
{
p = s.top();
if
(p->comp(*parent)>0)
p->left = parent;
else
p->right = parent;
}
// if
}
|
另外,旋转的代码我放在附件里面(如果都贴出来显得很臃肿),再者,附件里有一个“单词统计”的实验报告,有兴趣的同学可以下载看看。当时做实验的时候,AVL统计单词还是挺给力的:
漫谈引用调用
注意:ANSI C里不支持引用调用,而C++提供了引用调用的实现。
正如《effective c++》条款1提及的,指针和引用有应用上的区别。指针所指的对象可以随意更改,而且它的指向可以为null,非常灵活;但引用必须代表一个对象,不能为null,而且它被赋予某个对象后,它将始终代表那个对象知道被销毁为止。例如:
1
2
3
4
5
|
/***********************************
** sample
**********************************/
int
b = 1;
int
&a = b;
|
a成为了b的引用,a将不能再引用其他数据。另外,引用变量是否占有内存听说唯有定义(http://topic.csdn.net/u/20100622/15/728477fe-92ab-4e83-8572-0923d37186f1.html),笔者认为可行的方法是程序只在在变量的符号表中添加a,而并没有为a分配任何的内存。
在函数传参的过程中,有值传递,指针传递(都属于c)和引用传递方式(c++)。指针所能做到的,引用也可以做得到。但引用更安全(不至于让它为null),操作起来更方便,同时拥有和指针优点——“节能减排”。来看看:
1
2
3
4
5
6
7
8
9
10
|
/***********************************
** sample
**********************************/
function(TYPE * a)
a =
new
TYPE
****
main()
TYPE * a = NULL;
function(a);
***
|
在function返回后,a依旧为原来的NULL,并没有改变。因为你想,function函数栈内,只保存了指针a的原值NULL,即使a = new TYPE能为a赋予新址,但此a非彼a,在function退栈后,此a将被销毁,而彼a仍旧为NULL。因此如果想更改a指针的内容,必须使用指针的指针或者指针的引用,指针的引用会比较方便。
1
2
3
4
5
6
7
8
9
10
|
/***********************************
** sample
**********************************/
function(TYPE *& a)
a =
new
TYPE
****
main()
TYPE * a = NULL;
function(a);
***
|
这时,指针a的值才有所改变。AVL树的程序里有较多的引用调用,读者要注意。捣乱纳闷,这笔记,这大彻大悟,应早在大一就应该写下,羞愧于心,贻笑大方呐。
关于珠玑的总结
珠玑我到底还是把它当作休闲读物了,对于算法或者数据结构的初学者,这一本是力荐的。
附件:
本文完 Thursday, April 26, 2012