树与二叉树
1.树的基本概念
1.1 树的定义
树是n(n>=0)个节点的有限集。当n=0时,称为空树。在任意一棵非空树中应满足:
(1)有且仅有一个特定的称为根的结点。
(2)当n>1时,其余节点可分为(m>0)个互不相交的有限集T1,T2,…Tm,其中每个集合本身又是一棵树,并且称为根的子树。
显然,树的定义是递归的,即在树的定义中又用到了其自身,树是一种递归的数据结构。树作为一种逻辑结构,同时也是一种分层结构,具有以下两个特点:
(1)树的根结点没有前驱,除根结点外的所有结点有且只有一个前驱。
(2)树中所有结点可以有零个或多个后继。
树适合于表示具有层次结构的数据。树中的某个结点(除根结点外)最多只和上一层的一个结点(即其父结点)有直接关系,根结点没有直接上层结点,因此在n个结点的树中有n-1条边。而树中每个结点与其下一层的零个或多个结点(及其子女结点)有直接关系
1.2 基本术语
1)考虑结点K。根A到结点K的唯一路径上的任意结点,称为结点K的祖先。如结点B是结点K的祖先,而结点K是结点B的子孙。路径上最接近结点K的结点K的结点E称为K的双亲,而K为结点E的孩子。根A是树中唯一没有双亲的结点。有相同双亲的结点称为兄弟,如结点K和结点L有相同的双亲E,即K和L为兄弟。
2)树中一个结点的孩子个数称为该结点的度,树中结点的最大度数称为树的度。如结点B的度为2,结点D的度为3,树的度为3.
3)度大于0的结点称为分支结点(又称非终端结点);度为0 (没有子女结点)的结点称为
叶子结点(又称终端结点)。在分支结点中,每个结点的分支数就是该结点的度。
4)结点的深度、高度和层次。结点的层次从树根开始定义,根结点为第1层, 它的子结点为第2层,以此类雅。双亲在阿一层的结点互为堂兄弟, 图5.1 中结点G与E.EH.互为意兄弟。结点的深度是从根结点开始自顶向下连层累加的。结点的高度是从叶结点开始自底向上逐层累加的。树的高度(或深度)是树中结点的最大层数。
如图:B的结点的高度为3(从叶向上),结点的深度为2(从根向下)
图中树的高度为4.
5)有序树和无序树。树中结点的各子树从左到右是有次序的,不能互换,称该树为有序树,否则称为无序树。假设图5.1为有序树,若将子结点位置互换,则变成一棵不同的树。
6)路径和路径长度。树中两个结点之间的路径是由这两个结点之间所经过的结点序列构成的,而路径长度是路径上所经过的边的个数。
注意:由于树中的分支是有向的,即从双亲指向孩子,所以树中的路径是从上向下的,同一双亲的两个孩子之间不存在路径。
7)森林。森林是m (m>=0)棵互不相交的树的集合。森林的概念与树的概念十分相近,因为只要把树的根结点删去就成了森林。反之,只要给m棵独立的树加上一个结点,并把这m棵树作为该结点的子树,则森林就变成了树。
注意:上述概念无须刻意记忆,根据实例理解即可,考研不大可能直接考查概念,而都是结合具体的题目考查,做题时,遇到不熟悉的概念可以翻书,练习得多自然就记住了。
1.3 树的性质
树具有如下最基本的性质:
1)树中的结点数等于所有结点的度数加1.
2)度为m的树中第i层上至多有m^(i-1)个结点(i>=1)。
3)高度为h的m叉树至多有(m^h-1)/ (m - 1) 个结点”。
4)具有n个结点的m又树的最小高度为㏒m (n(m -1)+ 1)
2 二叉树的概念
2.1二 叉树的定义及其主要特性
1.二支树的定义
二又树是另一种树形结构, 其特点是每个结点至多只有两棵子树 (即二叉树中不存在度大于2的结点)。并且二叉树的子树有左右之分,其次序不能任意顺倒。
与树相似,一又树也以通归的形式定义。二又树是n (n>=0)个结点的有限集合:
①或者为空二又树,即n=0.
②成者由个根结点 和两个互不相交的被称为根的左子树和右子树组成。 左子树和右子树又分别是一棵二又树,二叉树是有序树,若将其左,右子树颠倒,则成为另棵不同的二叉树。 即使树中结点只有一棵子树,也要区分它是左子树还是右子树。
二叉树与度为2的有序树的区别:
①度为2的树至少有3个结点。而二又树可以为空。
②度为2的有序树的孩子的左右次序是相对于另一孩子而言的。若某个结点只有一个孩子,则这个孩子就无须区分其左右次序,而二叉树无论其孩子数是否为2.均需确定其左右次字,即二叉树的结点次序不是相对于另结点而言, 面是确定的 。
2.几个特殊的二叉树
1)满二叉树。棵高度为h, 且含有2^h - 1个结点的二又树称为满二叉树,即树中的每层都含有最多的结点。满二叉树的叶子结点都集中在一又树的最下一层。井且除叶子结点之外的每个结点度数均为2.可以对满二叉树按层序编号:约定编号从根结点(根结点编号为1)起,自上面下,自左向右。
这样,每个结点对应一个编号,对于编号为1的结点,
若有双亲,则其双亲为[i/2」,
若有左孩子,则左孩子为2i:
若有右孩子,则右孩子为2i+ 1.
2)完全二又树。高度为h、有n个结点的二又树,当且仅当其每个结点都与高度为h的满二又树中编号为1~n的结点一对应时,称为完全二又树
①若i ≤ n/2. 则结点i为分支结点, 否则为叶子结点。
②叶子结点只可能在层次最大的两层上出现。对于最大层次中的叶子结点,都依次排列在该层最左边的位置上。
③若有度为1的结点,则只可能有一个, 且该结点只有左孩子而无右孩子(重要特征)。
④按层序编号后,一旦出现某结点(编号为1)为叶子结点或只有左孩子,则编号大于i的结点均为叶子结点。
⑤若n为奇数,则每个分支结点都有左孩子和右孩子:若n为偶数,则编号最大的分支结点(编号为n2)只有左孩子,没有右孩子,其余分支结点左、右孩子都有。
3)二叉排序树。左子树上所有结点的关键字均小于根结点的关键字:右子树上的所有结点的关键子均大于根结点的关键字,左子树和在子树叉各见一的二叉排字树,树的深度之差不超过1.
4)平衡二叉树。树上任一结点的左子树和右子树的深度之差不超过1.
性质:结点i所在层次为[log2i]+1。下图。
2.2 二叉树的存储结构(后续更新)
2.2.1 顺序存储结构
二叉树的顺序存储是指用组地址连续的存储单元依次自 上而下、自左至右存储完全二又树上的结点元素,即将完全二义树上编号为i的结点元素存储在一维数组下标为i- 1的分量中。
依据二又树的性质,完全二叉树和满叉树采用顺序存储比较合适, 树中结点的序号可以唯一地反 映结点之间的逻辑关系,这样既能最大可能地节省存储空间,又能利用数组元素的下标值确定结点在二义树中的位置,以及结点之间的关系。
但对于一般的二叉树,为了让数组下标能反映二叉树中结点之间的逻辑关系,只能添加一些并不存在的空结点,让其每个结点与完全叉树 上的结点相对照, 再存储到维数组的相应分量中。然而,在最坏情况下,个高度为 h 且只有h个结点的单支树却需要占据近2^h - 1个存储单元。二叉树的顺序存储结构如下图所示,其中0表示并不存在的空结点。
注意:这种存储结构建议从数组下标1开始存储树中的结点,若从数组下标0开始存储,则不满足性质4的描述(比如结点4存储在0下标位置上时,无法根据性质4来计算出其孩子结点在数组中的位置),这是考生在书写程序时容易忽略的。
1 | 2 | 3 | 0 | 4 | 0 | 5 | 0 | 0 | 6 | 0 |
---|
2.2.2 链式存储结构
由于顺序存储的空间利用率较低,因此二叉树一般都采用链式存储结构,用链表结点来存储二叉树中的每个节点。
二叉树的链式存储结构描述如下:
typedef struct BiTNode{
ElemType data; //数据域
struct BiTNode *lchild, *rchild;//左、右孩子指针
}BiTNode, *BiTree;
lchild | data | rchild |
---|
含有n个结点的二叉链表中,有n+1个空链域
2n- (n-1)