树的概念和定义

最新推荐文章于 2024-08-03 15:30:21 发布

liu_zhоu

最新推荐文章于 2024-08-03 15:30:21 发布

阅读量2k

点赞数 3

分类专栏：树文章标签：二叉树树结构

本文链接：https://blog.csdn.net/liu_zhou_zhou/article/details/105560816

版权

树专栏收录该内容

1 篇文章 0 订阅

订阅专栏

前言

图1 树

上物，谓之树焉

基本概念

树是n（n≥0）个结点的有限集合T(Tree)。当n=0时，称为空树(其也是树)；当n>0时，该集合满足如下条件：

其中必有一个称为根（root）的特定结点，它没有直接前驱，但有零个或多个直接后继。
其余n-1个结点可以划分成m（m≥0）个互不相交的有限集T1，T2，T3，…，Tm，其中Ti又是一棵树，称为根root的子树。每棵子树的根结点有且仅有一个直接前驱，但有零个或多个直接后继。

知识点

结点：包含一个数据元素及若干指向其它结点的分支信息。
结点的度：一个结点的子树个数称为此结点的度。
叶结点：度为0的结点，即无后继的结点，也称为终端结点。
分支结点：度不为0的结点，也称为非终端结点。
孩子结点：一个结点的直接后继称为该结点的孩子结点。
双亲结点：一个结点的直接前驱称为该结点的双亲结点。
兄弟结点：同一双亲结点的孩子结点之间互称兄弟结点。
祖先结点：一个结点的祖先结点是指从根结点到该结点的路径上的所有结点。在图1中，结点K的祖先是A、B、E。
子孙结点：一个结点的直接后继和间接后继称为该结点的子孙结点。在图1中，结点D的子孙是H、I、 J、 M。
树的度：树中所有结点的度的最大值。
结点的层次：从根结点开始定义，根结点的层次为1，根的直接后继的层次为2，依此类推。
树的高度（深度）：树中所有结点的层次的最大值。
有序树：在树T中，如果各子树Ti之间是有先后次序的，则称为有序树。
森林： m（m≥0）棵互不相交的树的集合。将一棵非空树的根结点删去，树就变成一个森林；反之，给森林增加一个统一的根结点，森林就变成一棵树。

二叉树

二叉树的定义

定义：我们把满足以下两个条件的树形结构叫做二叉树（Binary Tree）：

每个结点的度都不大于2；
每个结点的孩子结点次序不能任意颠倒。

由此定义可以看出，一个二叉树中的每个结点只能含有0、 1或2个孩子（条件一），而且每个孩子有左右之分（条件二）。我们把位于左边的孩子叫做左孩子，位于右边的孩子叫做右孩子。

二叉树的基本形态

由二叉树的定义我们可知，二叉树应有以下五种基本形态（注意是左右子树）：
二叉树的基本形态

二叉树的性质

二叉树的性质1

在二叉树的第i层上至多有 2^i-1 个结点(i≥1)。

证明

采用数学归纳法证明。

归纳基础：当i=1时，整个二叉树只有一根结点，此时2^i-1=2⁰=1，结论成立。
归纳假设：假设i=k时结论成立，即第k层上结点总数最多为2^k-1个。

现证明当i=k+1时，结论成立：

因为二叉树中每个结点的度最大为2，则第k+1层的结点总数最多为第k层上结点最大数的2倍，即2×2^k-1=2^(k+1)-1，故结论成立。

二叉树的性质2

深度为k的二叉树至多有2^k-1个结点（k≥1）。

证明

因为深度为k的二叉树，其结点总数的最大值是将二叉树每层上结点的最大值相加，所以深度为k的二叉树的结点总数至多为

故结论成立。

二叉树的性质3

对任意一棵二叉树T，若终端结点数为n₀，而其度数为2的结点数为n₂，则n₀=n₂+1。

证明

设二叉树中结点总数为n， n1为二叉树中度为1的结点总数。
因为二叉树中所有结点的度小于等于2，所以有

n=n₀+n₂+n₂

设二叉树中分支数目为B(其实就是边数)，因为除根结点外，每个结点均对应一个进入它的分支，所以有

n=B+1

又因为二叉树中的分支都是由度为1和度为2的结点发出，所以分支数目为

B=n₁+2n₂

整理上述两式可得到

n=B+1=n₁+2n₂+1

将n=n₀+n1₁+n₂代入上式，得出n₀+n₁+n₂=n₁+2n₂+1，整理后得n₀=n₂+1，故结论成立。

满二叉树

深度为k且有2k-1个结点的二叉树。在满二叉树中，每层结点都是满的，即每层结点都具有最大结点数。图3(a)所示的二叉树，即为一棵满二叉树。
满二叉树的顺序表示，即从二叉树的根开始，层间从上到下，层内从左到右，逐层进行编号（1， 2， …， n）。例如图3(a)所示的满二叉树的顺序表示为(1， 2， 3， 4， 5， 6， 7， 8， 9， 10， 11， 12， 13， 14， 15)。

图3 满二叉树与完全二叉树

二叉树的性质4

具有n个结点的完全二叉树的深度为int(log₂n)+1。

证明

假设n个结点的完全二叉树的深度为k，根据性质2可知，k-1层满二叉树的结点总数为

n₁=2^k-1-1

k层满二叉树的结点总数为

n₂=2^k-1

显然有n₁<n≤n₂，进一步可以推出n₁+1≤n<n₂+1。
将n₁=2^k-1-1和n₂=2^k-1代入上式，可得2^k-1≤n<2^k，即k-1≤log₂n<k
因为k是整数，所以k-1=int(log₂n)，k=int(log₂n)+1, 故结论成立。

二叉树的性质5

对于具有n个结点的完全二叉树，如果按照从上到下和从左到右的顺序对二叉树中的所有结点从1开始顺序编号，则对于任意的序号为i的结点有：

（1）如i=1，则序号为i的结点是根结点，无双亲结点；如i>1，则序号为i的结点的双亲结点序号为int(i/2)。

（2）如2×i>n，则序号为i的结点无左孩子；如2×i≤n，则序号为i的结点的左孩子结点的序号为2×i。

（3）如2×i＋1>n，则序号为i的结点无右孩子；如2×i＋1≤n，则序号为i的结点的右孩子结点的序号为2×i＋1。

证明

可以用归纳法证明其中的（2）和（3）：

当i=1时，由完全二叉树的定义知，如果2×i=2≤n，说明二叉树中存在两个或两个以上的结点，所以其左孩子存在且序号为2；反之，如果2>n，说明二叉树中不存在序号为2的结点，其左孩子不存在。同理，如果2×i+1=3≤n，说明其右孩子存在且序号为3；如果3>n，则二叉树中不存在序号为3的结点，其右孩子不存在。

假设对于序号为j(1≤j≤i)的结点，当2×j≤n时，其左孩子存在且序号为2×j，当2×j>n 时，其左孩子不存在；当2×j+1≤n时，其右孩子存在且序号为2×j+1，当2×j+1>n时，其右孩子不存在。

当i=j+1时，根据完全二叉树的定义，若其左孩子存在，则其左孩子结点的序号一定等于序号为j的结点的右孩子的序号加1，即其左孩子结点的序号等于（2×j+1）+1=2（j+1）=2×i，且有2×i≤n；如果2×i>n，则左孩子不存在。若右孩子结点存在，则其右孩子结点的序号应等于其左孩子结点的序号加1，即右孩子结点的序号为2×i+1，且有2×i+1≤n；如果2×i+1>n，则右孩子不存在。

故（2）和（3）得证。

由（2）和（3）我们可以很容易证明（1）。

当i=1时，显然该结点为根结点，无双亲结点。当i>1时，设序号为i的结点的双亲结点的序号为m，如果序号为i的结点是其双亲结点的左孩子，根据（2）有i=2×m，即m=i/2; 如果序号为i的结点是其双亲结点的右孩子，根据（3）有i=2×m+1，即m=（i-1）/2=i/2-1/2，综合这两种情况，可以得到，当i>1时，其双亲结点的序号等于int(i/2)。

证毕。

二叉树的存储结构

二叉树的结构是非线性的，每一结点最多可有两个后继。

二叉树的存储结构有两种：顺序存储结构和链式存储结构。

顺序存储结构

图4 二叉树与顺序存储结构

图5 单支二叉树与其顺序存储结构

链式存储结构

对于任意的二叉树来说，每个结点最多只有两个孩子，一个双亲结点。我们可以设计每个结点至少包括三个域：数据域、左孩子域和右孩子域：

其中，LChild域指向该结点的左孩子，Data域记录该结点的信息，RChild域指向该结点的右孩子。

用C++可以这样声明二叉树的二叉链表结点的结构：

有时，为了便于找到父结点，可以增加一个Parent域， Parent域指向该结点的父结点。该结点结构如下：

图例

图6 二叉树和二叉链表

二叉树的性质6

若一个二叉树含有n个结点，则它的二叉链表中必含有2n个指针域，其中必有n＋1个空的链域。

证明

分支数目B=n-1，即非空的链域有n-1个，故空链域有2n-(n-1)=n+1个。

不同的存储结构实现二叉树的操作也不同。如要找某个结点的父结点，在三叉链表中很容易实现；在二叉链表中则需从根指针出发一一查找。可见，在具体应用中，需要根据二叉树的形态和需要进行的操作来决定二叉树的存储结构。

二叉树的遍历

我们用L、D、R分别表示遍历左子树、访问根结点、遍历右子树，那么对二叉树的遍历顺序就可以有六种方式：

访问根，遍历左子树，遍历右子树（记做DLR）。
访问根，遍历右子树，遍历左子树（记做DRL）。
遍历左子树，访问根，遍历右子树（记做LDR）。
遍历左子树，遍历右子树，访问根（记做LRD）。
遍历右子树，访问根，遍历左子树（记做RDL）。
遍历右子树，遍历左子树，访问根（记做RLD）。

注意：先序、中序、后序遍历是递归定义的，即在其子树中也按上述规律进行遍历。

先序遍历（DLR）

若二叉树为空，则空操作，否则依次执行如下3个操作：

访问根结点；
按先序遍历左子树；
按先序遍历右子树。

中序遍历（LDR）

若二叉树为空，则空操作，否则依次执行如下3个操作：

按中序遍历左子树；
访问根结点；
按中序遍历右子树。

后序遍历（LRD）操作过程：

若二叉树为空，则空操作，否则依次执行如下3个操作：

按后序遍历左子树；
按后序遍历右子树；
访问根结点。

图8 二叉树

先序遍历： A、 B、 D、 F、 G、 C、 E、 H 。

中序遍历： B、 F、 D、 G、 A、 C、 E、 H 。

后序遍历： F、 G、 D、 B、 H、 E、 C、 A 。

中序遍历二叉树的递归过程

最早提出遍历问题是对存储在计算机中的表达式求值。例如：（a+b*c）-d/e。该表达式用二叉树表示如图6.9所示。当我们对此二叉树进行先序、中序、后序遍历时，便可获得表达式的前缀、中缀、后缀书写形式：

前缀： -+a*bc/de

中缀： a+b*c-d/e

后缀： abc*+de/-

其中中缀形式是算术表达式的通常形式，只是没有括号。前缀表达式称为波兰表达式。后缀表达式被称作逆波兰表达式。在计算机内，使用后缀表达式易于求值。

图9 算术式的二叉树表示