树的存储结构
树的某个结点的孩子可以有多个,如果按顺序存储结构存储,数据元素挨个存储,我们就看不出谁是谁的双亲,谁是谁的孩子,简单的顺序存储结构不能满足树的实现要求。
但是可以充分利用顺序和链式存储结构特点实现对树的存储结构的表示。下面主要介绍三种表示法:双亲表示法、孩子表示法、孩子兄弟表示法。
1.双亲表示法
对于一个结点(根节点除外)可能没有孩子结点,但肯定有双亲。
假设以一组连续空间存储树的结点,每个节点中除了包含自己的数据之外,还包含双亲结点在数组中的位置。结构如下所示:
Data表示数据域,存储节点的数据信息。Parent表示指针域,存储该节点的双亲在数组中的下标。
由于根节点没有双亲,规定其指针域的值为-1。 这样,就能通过一个顺序结构来存储一个树。
如:下图的树结构的双亲表示法
对于一个结点,我们可以很容易找到它的双亲结点,其时间复杂度为O(1)。但是,如果要知道它的孩子是什么,要遍历整个结构才行,其时间复杂度为O(n)。
2.孩子表示法
由于树中每个结点可能有很多棵子树,可以考虑用多重链表,即每个节点有多个指针域,其中每个指针域指向一颗子树的根结点,我们把这种访问称为多重链表表示法。
但是,每个结点的度不同,也就是它的孩子的个数不同,可以有两个方法来解决:
①方案一:指针域的个数等于树的度
树的度是每个结点度的最大值,即有最多孩子结点的孩子个数。其结构如下:
其中,K为树的度,Data为数据域,Child1~K为k个孩子的指针域。这样就可以存储一个树。
这种方法对于树中各节点的度相差很大时,显然是很浪费空间的,很多结点的指针域都是空的。
②方案二:孩子表示法
孩子表示法是用数组和链表结合的方式来表示的,以单链表作存储结构把每个结点的孩子结点排列起来,如果是叶子结点则此单链表为空。然后n个头指针又组成一个线性表,采用顺序存储结构,存放进一个一维数组中。
为此设计两种结点结构:
- 孩子链表的孩子结点,如下表所示:
child为数据域存放某个结点在表头数组中的下标,next为指针域,用来存储指向下一个孩子节点的指针。
- 表头数组的表头结点,如下表所示:
data为数据域,存放某结点的数据信息;firstchild为头指针域,存储该节点的孩子链表的头指针。
这样就可以用孩子表示法来存储树。
如:还是上述的树结构
上述树的孩子表示法存储结构为:
孩子表示法存储结构对于我们想要查找某个结点的某个孩子很方便,或者找某个结点的兄弟,只要查找这个孩子的单链表即可。对于遍历整棵树也很方便,对头节点数组遍历即可。
但是,这也存在一个问题,我们不知道一个结点的双亲是谁。
3.孩子兄弟表示法
任意一颗树,它的结点的第一个孩子如果存在就是唯一的,它的右兄弟如果存在也是唯一的。因此,我们设置两个指针,分别指向该节点的第一个孩子和此节点的右兄弟结点的地址。
其节点结构如下表所示:
其中,Data为数据域;Firstchild为指针域,存储该结点第一个孩子结点的地址;Rightsib存储该节点的右兄弟结点的地址。
如:
上述树的孩子兄弟表示法存储结构为:
这种方法,查找某个孩子的某个孩子和兄弟带来方便。这个表示法最大的好处是它把一颗复杂的树变成了一颗二叉树,这样就可以充分利用二叉树的性质了。
上图的表示可以变成如下形式: