一. 树的概念
- 树(Tree)是n(n>=0)个结点的有限集。
- 当 n = 0 时,称为空树。
- 在任意一颗非空树中:
- 有且仅有一个特定的称为 根(Root) 的结点;
如上图,A为根 - 当 n > 1 时,其余结点可分为m(m > 0)个互不相交的有限集T1,T2,T3…Tm,其中每一个集合本身又是一颗树,并且称为根的子树。
B,C,D称为A的子树
- 树的结点包含一个数据元素及若干指向其子树的分支。
- 结点拥有的子树个数称为结点的度。
A的子树个数有3个,即度为3。B的子树个数为0,即度为0。 - 度为0的结点称为叶子或终端结点。
B,H,F,G的度为0,即B,H,F,G称为叶子结点。 - 度不为0的结点称为非终端结点或分支结点。
如A,C,D,E。 - 树的度是树内各结点的度的最大值。
A的度为3,在所有结点中式最大的,即树的度就是3。 - 结点的子树的根称为该结点的孩子,相应的,该结点称为孩子的双亲。
结点H是结点E的孩子结点,反之,E是H的双亲结点。 - 同一个双亲的孩子之间互称为兄弟。
E和F互为兄弟。 - 结点的祖先是从根到该结点所经分支上的所有结点,反之,以某结点的根的子树中的任一结点都称为该结点的子孙。
H的祖先是A,C,E。 C的子孙是E,F,H。 - 结点的层次从根开始定义起,根为第一层,根的孩子为第二层。
- 若某结点在第 l 层,则其子树的根就在第 l + 1 层。其双亲在同一层的结点互称为堂兄弟。
- 树中结点的最大层次称为树的深度或高度。
图中树的深度为3。 - 如果将树中结点的各子树看成从左至右是有序次的(即不能互换),则称该树为有序树,否则称为无序树。
二. 树的存储结构
(一). 双亲表示法
- 这种存储结构是一种顺序存储结构,用一组连续空间存储树的所有结点,同时在每个结点中附设一个下标(伪指针)指示其双亲结点的位置。
- 结点结构表示为:
data值就是结点的数据值,parent表示这个数据结点的双亲结点在这个空间中存放的位置。 - 如
可表示为:
- 因为parent指向双亲的位置,并没有指向孩子结点的指针,因此
使用双亲表示法找出双亲结点的时间复杂度为O(1),找出孩子结点必须要全部遍历一遍,时间复杂度为O(n)
。 - 双亲存储结构的类型声明:
#define MAX_TREE_SIZE 100
struct PTNode{
TElem Type data;
int parent; //双亲位置域
};
struct PTree{
PTNode nodes[MAX_TREE_SIZE];
int r,n; //根的位置,结点数
};
(二). 孩子表示法
由于树中每个结点可能有多棵子树,则可用多重链表,即每个结点有多个指针域,其中每个指针指向一棵子树的根节点,此时链表中的结点可以有如下两种结点格式:
1. 定长结点链表存储结构
孩子链表存储结构可按树的度设计结点的孩子结点指针域个数
2. 孩子链表存储结构
- 把每个结点的孩子结点排列起来,看成是一个线性表,且以单链表作存储结构,则n个结点有n个孩子链表(叶子的孩子链表为空表)。
而n个头指针又组成一个线性表,为了便于查找,可采用顺序存储结构。如下图:
- 为此,需要设计两种结点结构:
- 树的孩子链表孩子兄弟表示:
typedef struct CTNode{ //孩子结点
struct CTNode *next;
int child;
};
typedef struct{
TElem data;
ChildPtr firstchild; //孩子链表头指针
}CTBox;
typedef struct {
CTBox nodes[MAX_TREE_SIZE];
int r,n; //根的位置,结点数
}CTree;
(三). 孩子兄弟表示法
- 又称二叉树表示法,或二叉链表表示法。
- 以二叉链表作树的存储结构。链表中结点的两个链域分别指向该结点的第一个孩子结点和下一个兄弟结点,分别命名为 firstchild域和 nextchild域。
- 树的二叉链表(孩子—兄弟)存储表示:
typedef struct CSNode{
TElemType data;
CSNode *firstchild, *nextchild;
}CSNode *CSTree;