树的定义
定义: 树是n(n>=0)个结点的有限集。n=0时称为空树。在任意一棵非空树中:
(1)有且仅有一个特定的称为根的结点
(2)当n > 1时,其余结点可分为m(m > 0)个互不相交的有限集T1、T2、…、Tm,其中每一个集合本身又是一棵树,并且称为根的子树。
除了以上的定义,还需要强调两点:
(1)n > 0时根结点是唯一的,不可能存在多个根结点。
(2)m > 0时子树的个数没有限制,但它们一定是互不相交的。
下面是一棵树的示例:
在明白树的定义之后,还有一些概念需要明白:
(1)树的分类:叶节点、分支结点
叶节点是指度为0的结点
分支结点是指度不为0的结点
结点的度是指该结点拥有的子树的数量,比如上图中D结点的度为3,A结点的度为2
(2)结点之间的关系:祖先、子孙、兄弟、堂兄弟
结点的祖先是指从根到该结点所经分支上的所有结点。比如G、H、I的祖先都为A、B、D
结点的子孙是指以某个结点为根的子树中的任一结点都称为该结点的子孙。比如D结点的子孙为G、H、I
兄弟是指同一个双亲的孩子结点之间称为兄弟。比如以A为双亲(根结点),那么B和C就是兄弟
堂兄弟是指双亲在同一层的结点的子结点称为堂兄弟。比如B和C在同一层,那么D、E、F就是堂兄弟
(3)树的度就是树内各结点的度的最大值。上图中数的度为3
(4)树的深度或高度就是树中结点的最大层次。上图中树的深度为4
> 结点的层次从根开始定义,根为第一层,根的孩子为第二层,以此类推
(5)森林是m(m >= 0)棵互不相干的数的集合。上图中就是森林,因为包含有T1、T2等子树
(6)如果将树中结点的各子树看成从左至右是有次序的,不能互换的,则称该树为有序树,否则称为无序树
树的抽象数据类型
ADT 树(tree)
Data
树是由一个根结点和若干棵子树构成。树中结点具有相同数据类型及层次关系
Operation
InitTree(*T):构造空树T
DestroyTree(*T):销毁树T
CreateTree(*T,definition):按definition中给出树的定义来构造树
ClearTree(*T):若树T存在,则将树T清为空树
TreeEmpty(T):若树T为空树,返回true,否则返回flase
TreeDepth(T):返回树的深度
Root(T):返回T的根结点
Value(T,cur_e):cur_e是树T中一个结点,返回其结点的值
Assign(T,cur_e,value):给树T的结点cur_e赋值为value
Parent(T,cur_e):若cur_e是树T的非根结点,则返回它的双亲,否则返回空
LeftChild(T,cur_e):若cur_e是树T的非叶结点,则返回它的最左孩子,否则返回空
RightSibling(T,cur_e):若cur_e有右兄弟,则返回它的右兄弟,否则返回空
InsertChild(*T,*p,i,c):其中p指向树T的某个结点,i为所指结点p的度加上1,非空树c与T不相交,操作结果为插入c为树T中p指结点的第i棵子树
DeleteChild(*T,*p,i):其中p指向树T的某个结点,i为所指结点p的度,操作结果为删除T中p所指结点的第i棵子树
endADT
树的存储结构
这里我们介绍三种树的表示方法:双亲表示法、孩子表示法、孩子兄弟表示法。它们分别从不同的角度去表示数结构,下面我们一一说明。
1.双亲表示法
我们假设以一组连续空间(数组)存储树的结点,同时在每个结点中,附设一个指示器指示其双亲结点在数组中的位置。也就是说每个结点除了知道自己是谁以外,还知道它的双亲在哪里。
其中data是数据域,存储结点的数据信息。而parent是指针域,存储该结点的双亲在数组中的下标。以下是我们的双亲表示法的结点结构定义代码:
//树的双亲表示法结点结构定义
#define MAX_TREE_SIZE 100;
//树结点的数据类型,目前暂定为整型
typedef int TElemType;
//结点结构
typedef struct PTNode{
TElemType data;
int parent;
}PTNode;
//树结构
typedef struct{
PTNode nodes[MAX_TREE_SIZE];
int r,n;
}PTree;
由于根结点没有双亲,我们约定根结点的位置域为-1。如下为树结构,及其双亲表示法:
下标 | data | parent |
---|---|---|
0 | A | -1 |
1 | B | 0 |
2 | C | 0 |
3 | D | 1 |
4 | E | 2 |
5 | F | 2 |
6 | G | 3 |
7 | H | 3 |
8 | I | 3 |
9 | J | 4 |
这样的存储结构,我们查找一个结点的双亲的时间复杂度为O(1),直到parent为-1,表示找到了树的根结点。但是如果我们要知道结点的孩子是什么呢?我们只能遍历整个结构才行。
当然也有别的改进的方法,存储结构的设计是一个非常灵活的过程。一个存储结构设计的是否合理,取决于基于该存储结构的运算是否适合、是否方便,时间复杂度好不好等。比如针对上面我们要知道结点的孩子,我们可以为结点增加一个结点最左边孩子的域,没有孩子的结点,该域为-1。
下标 | data | parent | firstchild |
---|---|---|---|
0 | A | -1 | 1 |
1 | B | 0 | 3 |
2 | C | 0 | 4 |
3 | D | 1 | 6 |
4 | E | 2 | 9 |
5 | F | 2 | -1 |
6 | G | 3 | -1 |
7 | H | 3 | -1 |
8 | I | 3 | -1 |
9 | J | 4 | -1 |
同理如果除了双亲,我们还关注结点的孩子、兄弟,我们可以为结点添加相关的域,比如长子域、右兄弟域等等。
2.孩子表示法
在介绍孩子表示法之前,先介绍一下多重链表表示法
,多重链表表示法是指每个结点有多个指针域,其中每个指针指向一棵子树的根结点。不过,树的每个结点的度不同的,所以有两种实现方式:
(1)以树的度来固定分配每个结点的指针域。在时间上,效率上稍微高一点;在空间上,如果各个结点的度相差较大时,会造成空间浪费,如果相差度小,则缺点反而成为优势。
(2)根据每个结点的度动态指定每个结点的指针域。在时间上,效率稍微低一点,因为需要去动态的维护每个结点的指针域;在空间上,利用率较高
那么对于上面的多重链表表示法,有什么更好的方法,既可以减少空指针导致的空间浪费,又能使结点结构相同?那就是我们的孩子表示法
。具体是:把每个结点的孩子结点排列起来,以单链表作存储结构,则n个结点有n个孩子单链表,如果是叶子结点则此单链表为空。然后n个头指针又组成一个线性表,采用顺序存储结构,存放在一个一维数组中。
以下是我们的孩子表示法的结构定义代码: