第 5 章 树和二叉树
树是一类重要的非线性数据结构,树形结构是以分支关系来定义的层次结构。在客观世界中树形结构广泛存在,并应用于:
•人类社会的族谱、家谱、行政区域划分管理;
•各种社会组织机构;
•在计算机领域中,用树表示源程序的语法结构;
•在操作系统(OS)中,文件系统、目录等组织结构也是用树来表示的。
本章的主要内容是
¾树的逻辑结构
¾树的存储结构
¾二叉树的逻辑结构
¾二叉树的存储结构及实现
¾树、森林与二叉树的转换
¾哈夫曼树
树的定义
树:n(n≥0)个结点的有限集合。当n=0时,称为
空树;任意一棵非空树满足以下条件:
⑴有且仅有一个特定的称为根的结点;
⑵当n>1时,除根结点之外的其余结点被分成m (m>0)个互不相交的有限集合T1,T2,…
,Tm,其中每个集合又是一棵树,并称为这个根结点的子树。
树的定义是采用递归方法
树的基本术语
结点的度:结点所拥有的子树的个数。
树的度:树中各结点度的最大值。
叶子结点:度为0的结点,也称为终端结点。
分孩子、双亲:树中某结点子树的根结点称为这个结点的孩子结点,这个结点称为它孩子结点的双亲结点;兄弟:具有同一个双亲的孩子结点互称为兄弟。
支结点:度不为0的结点,也称为非终端结点
祖先、子孙:在树中,如果有一条路径从结点x到结点y,那么x就称为y的祖先,而y称为x的子孙。
结点所在层数:根结点的层数为1;对其余任何结点,若某结点在第k层,则其孩子结点在第k+1层。
树的深度:树中所有结点的最大层数,也称高度。
层序编号:将树中结点按照从上层到下层、同层从左到右的次序依次给他们编以从1开始的连续自然数。
有序树、无序树:如果一棵树中结点的各子树从左到右是有次序的,称这棵树为有序树;反之,称为无序树。
第一个数据元素根结点(只有一个)无前驱无双亲
最后一个数据元素叶子结点(可以有多个)
无后继无孩子其它数据元素其它结点
一个前驱,一个后继一个双亲,多个孩子一对一 一对多
树的抽象数据类型定义
ADT
Tree Data
树是由一个根结点和若干棵子树构成,树中结点具有相同数据类型及层次关系
Operation
InitTree
前置条件:树不存在输入:无功能:初始化一棵树输出:无后置条件:构造一个空树
树的抽象数据类型定义
DestroyTree
前置条件:树已存在输入:无功能:销毁一棵树输出:无
后置条件:释放该树占用的存储空间
Root
前置条件:树已存在输入:无功能:求树的根结点输出:树的根结点的信息后置条件:树保持不变
树的抽象数据类型定义
Parent
前置条件:树已存在输入:结点x 功能:求结点x的双亲输出:结点x的双亲的信息后置条件:树保持不变
Depth
前置条件:树已存在输入:无功能:求树的深度输出:树的深度后置条件:树保持不变
树的抽象数据类型定义
PreOrder
前置条件:树已存在输入:无功能:前序遍历树输出:树的前序遍历序列后置条件:树保持不变
PostOrder
前置条件:树已存在输入:无功能:后序遍历树
输出:树的后序遍历序列后置条件:树保持不变 endADT
树的遍历操作
树的遍历:从根结点出发,按照某种次序访问树中所有结点,使得每个结点被访问一次且仅被访问一次。如何理解访问?
树的前序遍历操作定义为:若树为空,则空操作返回;否则
⑴访问根结点;
⑵按照从左到右的顺序前序遍历根结点的每一棵子树。
树的后序遍历操作定义为:若树为空,则空操作返回;否则
⑴ 按照从左到右的顺序后序遍历根结点的每一棵子树;
⑵访问根结点。
树的层序遍历操作定义为:从树的第一层(即根结点)开始,自上而下逐层遍历,在同一层中,按从左到右的顺序对结点逐个访问。
孩子表示法——多重链表表示法
如何确定链表中的结点结构?
链表中的每个结点包括一个数据域和多个指针域,每个指针域指向该结点的一个孩子结点。
方案二:指针域的个数等于该结点的度
data degree child1 child2 …… childd
其中:data:数据域,存放该结点的数据信息; degree:度域,存放该结点的度; child1~childd:指针域,指向该结点的孩子。缺点:结点结构不一致
孩子表示法——孩子链表表示法
如何确定链表中的结点结构?
将结点的所有孩子放在一起,构成线性表。
基本思想:把每个结点的孩子排列起来,看成是一个线性表,且以单链表存储,则n个结点共有 n 个孩子链表。这 n 个单链表共有 n
个头指针,这 n
个头指针又组成了一个线性表,为了便于进行查找采用顺序存储。最后,将存放
n 个头指针的数组和存放n个结点的数组结合起来,构成孩子链表的表头数组。
二叉树的定义
二叉树是n(n≥0)个结点的有限集合,该集合或者为空集(称为空二叉树),或者由一个根结点和两棵互不相交的、分别称为根结点的左子树和右子树的二叉树组成。
二叉树的特点:
⑴每个结点最多有两棵子树; ⑵二叉树是有序的,其次序不能任意颠倒。
斜树
1 .所有结点都只有左子
树的二叉树称为左斜树;
2 .所有结点都只有右子树的二叉树称为右斜树; 3.左斜树和右斜树统称为
斜树。
- 在斜树中,每一层只有一个结点;斜树的特点:
2.斜树的结点个数与其深度相同。
特殊的二叉树满二叉树
在一棵二叉树中,如果所有分支结点都存在左子树和右子树,并且所有叶子
都在同一层上。 O
9 10
11 12 13 14 15 满二叉树的特点: 1.
叶子只能出现在最下一层;
只有度为0和度为2的结点。
完全二叉树的特点
-
叶子结点只能出现在最下
两层,且最下层的叶子结点 H 都集中在二叉树的左部;
-
完全二叉树中如果有度为
1的结点,只可能有一个,且该结点只有左孩子。
-
深度为k的完全二叉树在 k-1层上一定是满二叉树。
二叉树的基本性质
性质5-1 二叉树的第i层上最多有2i-1个结点(i≥1)。
证明:当i=1时,第1层只有一个根结点,而
2i-1=20
=1,结论显然成立。
假定i=k(1≤k<i)时结论成立,即第k层上至多有 2k-1个结点,则 i=k+1时,因为第k+1层上的结点是第k层上结点的孩子,而二叉树中每个结点最多有2 个孩子,故在第k+1层上最大结点个数为第k层上的最大结点个数的二倍,即2×2k-1=2k。结论成立。
二叉树的基本性质
性质5-2
一棵深度为k的二叉树中,最多有2k-1个结点,最少有k个结点。
证明:由性质1可知,深度为k的二叉树中结点个数最多
=
∑ (k)(第i层上结点的最大个数
=2) k-1;
每一(i=1)层至少要有一个结点,因此深度为k的二叉树,至少有k个结点。
深度为k且具有2k-1个结点的二叉树一定是满二叉树,深度为k且具有k个结点的二叉树不一定是斜树。
二叉树的基本性质
性质5-3
在一棵二叉树中,如果叶子结点数为n0,度为2的结点数为n2,则有: n0=n2+1。
证明:设n1为二叉树T中度为1的结点数
同理:三次树:四次树:
∵ 二叉树中所有结点的度均小于或等于2
∴ 结点总数n=n +n +n (1) 除根结点外,其余结点都只有一个
分支进入,设B为分支总数,则n=B+1 (2) 又:分支由度为1和度为2的结点射出,
∴B=n1+2n2 于是,n=B+1=n1+2n2+1
(3)
∴由式(1)和(3)得 n0=n2+1
n0=1+n2+2n3
n0=1+n2+2n3+3n4
…
K次树: n0=1+n2+2n3+…+(k-1)nk
二叉树的基本性质
性质5-3
在一棵二叉树中,如果叶子结点数为n0,度为2的结点数为n2,则有: n0=n2+1。
在有n个结点的满二叉树中,有多少个叶子结点?因为在满二叉树中没有度为1的结点,只有度为0的叶子结点和度为2的分支结点,所以, n= n0 +
n2 n0=n2 + 1
即叶子结点n0=(n + 1)/2
二叉树的遍历操作前序(根)遍历
若二叉树为空,则空操作返回;否则:
①访问根结点;
②前序遍历根结点的左子树;
③前序遍历根结点的右子树。
前序遍历序列:A B D G C E F
二叉树的遍历操作中序(根)遍历
若二叉树为空,则空操作返回;否则:
①中序遍历根结点的左子树;
②访问根结点;
③中序遍历根结点的右子树。
中序遍历序列:D G B A E C F
二叉树的遍历操作后序(根)遍历
若二叉树为空,则空操作返回;否则:
①后序遍历根结点的左子树;
②后序遍历根结点的右子树。
③访问根结点;
后序遍历序列:G D B E F C A
二叉树的遍历操作层序遍历
二叉树的层次遍历是指从二叉树的第一层(即根结点)开始,从上至下逐层遍历,在同一层中,则按从左到右的顺序对结点逐个访问。
层序遍历序列:A B C D E F G
二叉树遍历操作练习