5.1 树和二叉树的定义
树结构是一类重要的非线性数据结构。直观来看,树是以分支关系定义的层次结构。树结构在客观世界中广泛存在,如人类社会的族谱和各种社会组织都可用树来形象表示。
5.1.1 树的定义
树是有n个结点的集合
(
n
>
=
0
)
(n>=0)
(n>=0),当
n
=
0
n=0
n=0时,它为空树。而对于非空树,它有以下几个特点:
1)有且只有一个根节点;
2)除根节点之外,其余结点可分为m个互不相交的有限集
T
1
T_{1}
T1、
T
2
,
.
.
.
,
T_{2},...,
T2,...,
T
n
T_{n}
Tn,其中每一个集合本身又是一棵树,并且称为根的子树。
上述概念是否看起来有点难以理解呢?下面我们将给出一个树结构的具体例子。
根据上图,我们可以进一步给出树的基本术语
5.1.2 树的基本术语
1)结点:树中的一个独立单元。如上图中所有有字母存在的圆圈就是一个个的结点。
2)结点的度:结点拥有的子树的数量称为结点的度。例如,A的下方还有三个结点,A的度就为3,F的下方没有结点,F的度就为0.
3)树的度:树的度是树内各结点度的最大值。上图中,结点拥有的度最大为3,也就是一个结点下面拥有最多结点的数量为3,于是上树的度为3(注意,不要将结点的度和树的度混淆)。
4)叶子:度为0的结点。也就是该结点的下方不再有结点。例如上图中的K、L、F、G、I、J、M。
5)非终端结点:度不为0的结点称为非终端结点或分支结点。除根节点外,非终端结点也称内部结点。
6)双亲和孩子:结点的子树的根称为该结点的孩子,相应地,该结点称为孩子的双亲。例如,B的双亲为A,B的孩子有E和F。
7)兄弟:同一个双亲的孩子之间互称兄弟。例如,H、I和J互为兄弟。
8)祖先:从根到该结点所经分支上的所有结点。例如,M的祖先为A、D、H。
9)子孙:以某节点为根的子树中的任一结点都称为该结点的子孙。如B的子孙为E、K、L和F。
10)层次:结点的层次从根开始定义起,根为第一层,根的孩子为第二层。树中任一结点的层次等于其双亲结点的层次加1。上图中右侧即为该树的层次划分图。
11)堂兄弟:双亲在同一层的结点(建议多读几次深刻理解以下这句话)。例如,结点G与E、F、H、I、J互为堂兄弟。
12)树的深度:树中结点的最大层次称为树的深度或高度。
13)有序树、无序树:如果将树中结点的各子树看成从左至右是有次序的(即不能互换),则称该树为有序树,否则称为无序树。在有序树中最左边的子树的根称为第一个孩子,最右边的称为最后一个孩子。
14)森林:是m棵互不相交的树的集合。对树中每个结点而言,其子树的集合即为森林。
5.1.3 二叉树的定义
二叉树(Binary Tree)是n ( n > = 0 ) (n>=0) (n>=0)个结点所构成的集合, n = 0 n=0 n=0时它为空树。对于非空二叉树T:
- 有且仅有一个称之为根的结点。
- 除根节点以外的其余结点分为两个互不相交的子集 T 1 T_{1} T1、 T 2 T_{2} T2,分别称为T的左子树和右子树,且 T 1 T_{1} T1、 T 2 T_{2} T2本身又都是二叉树。
从字面上来看,树和二叉树仅有“二叉”之别,显然二叉树是属于树的种类的,它的特别之处就在于这个“二”:
- 二叉树每个结点至多只有两颗子树(即二叉树中不存在度大于2的结点,也就是孩子不能多余两个。需要注意的是,不大于2就表示可以有1,不要过度局限于“二”叉树)。
- 二叉树的子树有左右之分,其次序不能任一颠倒。
二叉树除了与一般的树不同外,还有它自己的性质。
5.4 二叉树的性质和存储结构
5.4.1二叉树的性质
- 在二叉树的第i层上至多有 2 i − 1 2^{i-1} 2i−1个结点 ( i > = 1 ) (i>=1) (i>=1)。
- 深度为k的二叉树至多有 2 k − 1 2^k-1 2k−1个结点 ( k > = 1 ) (k>=1) (k>=1)。
- 对任何一棵二叉树T,如果其终端结点(叶子)数为 n 0 n_0 n0,度为2的结点数为 n 2 n_2 n2,则有 n 0 = n 2 + 1 n_0=n_2+1 n0=n2+1。即度为0的结点数总比度为2的结点数多1。
在二叉树中,有时我们会遇到其特殊的形态,如满二叉树、完全二叉树等。下面我们将举例来加深对二叉树特殊情形的印象:
上图(a)就是一个深度为4的满二叉树。
满二叉树:深度为k且含有
2
k
−
1
2^k-1
2k−1个结点的二叉树。
其特点是:每一层上的结点数都是最大结点数,即每一层i的结点数都具有最大值
2
i
−
1
2^{i-1}
2i−1。
我们可以对满二叉树的结点进行连续编号,约定编号从根节点起,自上而下,自左至右。由此,我们可以引出完全二叉树的定义。
完全二叉树:深度为k的,有n个结点的二叉树,当且仅当每一个结点都与深度为k的满二叉树中编号从1至n的结点一一对应时,称之为完全二叉树。上图中(b)就是一棵深度为4的完全二叉树。
其特点是:
1)叶子结点只可能在层次最大的两层上出现;
2)对任一结点,其右下分支子孙的最大层次一定
<
=
<=
<=左下分支子孙的最大层次。
完全二叉树在很多场合下出现,所以下面两个性质是完全二叉树的两个重要特性。
- 具有n个结点的完全二叉树的深度为 ⌊ l o g 2 n ⌋ + 1 \lfloor log_2n \rfloor+1 ⌊log2n⌋+1。( ⌊ x ⌋ \lfloor x \rfloor ⌊x⌋,表示不大于x的最大整数)
- 如果对一棵有n个结点的完全二叉树的结点按层序编号(从上至下,从左至右),则对任一结点i ( 1 < = i < = n ) (1<=i<=n) (1<=i<=n)有
- 如果i=1,则结点i是二叉树的根,无双亲;如果i>1,则其双亲PARENT(i)是结点 ⌊ i / 2 ⌋ \lfloor i/2 \rfloor ⌊i/2⌋。
- 如果2i>n,则结点i无左孩子(结点i为叶子结点);否则其左孩子LCHILD(i)是结点2i。
- 如果2i+1>n,则结点i无右孩子;否则其右孩子RCHILD(i)是结点2i+1。
那么,二叉树的存储结构是怎样的呢?
5.4.2 二叉树的存储结构
类似于线性表,二叉树的存储结构也分为顺序存储和链式存储两种方式。
1.顺序存储结构
从前面我们画的树的结构图来看,每个结点都是通过其孩子和双亲链接在一起,进而构成一个整体,而这个整体是“不可分割”的。那么我们该用什么样的数据类型来存储每个结点的数据呢?
在C语言中,数组是用一组连续的存储单元来存储其数据元素,所以我们可以考虑用数组来存储树中结点的值。
#define MAXTSIZE 100
typedef TElemType SqBiTree[MAXTSIZE];
SqBiTree bt;
为了能够在存储结构中反映除结点之间的逻辑关系,必须将二叉树中的结点依照一定的规律安排在这组单元中。
- 对于完全二叉树而言,我们只需要从根开始,按层序,从上到下,从左至右依次存储在数组即可。即先存储根节点,然后到第二层从左至右依次存储,存储完了之后又到第三层…
下面我们就前面的特殊二叉树图中的完全二叉树为例子,下面给出它在数组中的存储顺序
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 |
---|
- 对于一般二叉树,如下图所示
就上图的非完全二叉树而言,应将其每个结点与完全二叉树上的结点相对照,存储在一维数组的相应分量中,如下表所示
1 | 2 | 3 | 4 | 5 | 0 | 0 | 0 | 0 | 6 | 7 |
---|
图中以“0”来表示不存在此结点。
由此可见,这种顺序结构仅适用于完全二叉树。若用来表示非完全二叉树,我们从上图就可以知道它的数组存储结构中仍有“空位”,也就是值为0的存储空间,这样就造成了存储空间的浪费。所以,对于一般二叉树,就更适合下面的链式存储结构。
2.链式存储结构
从前面我们可以知道,所谓链式存储结构,就是用人为命名的结点来存储元素的值,而结点之间通过指针相连接,既然要用到指针,那么结点之中就一定要有存放另一个结点地址的位置,也就是我们所说的指针域。
指针域是用来将各个结点连成一个整体,那么对于二叉树这样的结构,我们该设计怎样的结点呢?
由二叉树的性质可知,一个二叉树的结点由一个数据元素和分别指向其左、右子树的两个分支构成,则表示二叉树的链表中结点至少包含3个域:数据域和左、右指针域。由此,我们可以得到二叉树的结点结构如下图。
知道了它结点的结构之后,那么其代码的实现就简单了。
typedef struct BiTNode
{
TElemType data;
struct BiTNode *lchild,*rchild;
}BiTNode,*BiTree;
最后我们再给出链表存储结构的示意图来加强理解。