本专题的内容是树,是一种区别于线性表的另一种逻辑的数据结构,它作为数据结构中最重要的部分之一,我们有必要熟练理解并掌握树的相关概念及应用。本章作为本专题第一章节,主要介绍树的一些定义以及二叉树的定义和重要性质,二叉树作为及其重要的数据结构,内容及其变形应用是相当复杂的,我们计算机专业的有相当一部分人都会在数据结构考试的时候“挂在树上”,不过不要担心,从简单的性质学起,循序渐进地搞定它们。进入主题,树与二叉树。
树
定义
树(tree)是包含n(n>0)个结点的有穷集,其中:(1)每个元素称为结点(node);
(2)有一个特定的结点被称为根结点或树根(root)。
(3)除根结点之外的其余数据元素被分为m(m≥0)个互不相交的集合T1,T2,……Tm-1,其中每一个集合Ti(1<=i<=m)本身也是一棵树,被称作原树的子树(subtree)。
树也可以这样定义:树是由根结点和若干颗子树构成的。树是由一个集合以及在该集合上定义的一种关系构成的。集合中的元素称为树的结点,所定义的关系称为父子关系。父子关系在树的结点之间建立了一个 层次结构。在这种层次结构中有一个结点具有特殊的地位,这个结点称为该树的根结点,或称为树根。
我们可以形式地给出树的递归定义如下:
单个结点是一棵树,树根就是该结点本身。
设T1,T2,..,Tk是树,它们的根结点分别为n1,n2,..,nk。用一个新结点n作为n1,n2,..,nk的父亲,则得到一棵新树,结点n就是新树的根。我们称n1,n2,..,nk为一组兄弟结点,它们都是结点n的子结点。我们还称T1,T2,..,Tk为结点n的子树。
空集合也是树,称为空树。空树中没有结点。
如上图所示,黑色的是树形结构,粉色框起来的部分是整棵树,箭头所指是整棵树根结点,它的每一个子节点都可以作为它子树的根,如图,蓝色和橙色是粉色的子树,绿色是蓝色的子树。
相关术语
结点的度:一个结点含有的子结点的个数称为该结点的度;
叶结点或终端结点:度为0的结点称为叶结点;
非终端结点或分支结点:度不为0的结点;
双亲结点或父结点:若一个结点含有子结点,则这个结点称为其子结点的父结点;
孩子结点或子结点:一个结点含有的子树的根结点称为该结点的子结点;
兄弟结点:具有相同父节点的结点互称为兄弟结点;
树的度:一棵树中,最大的结点的度称为树的度;
节点的层次:从根开始定义起,根为第1层,根的子节点为第2层,以此类推;
树的高度或深度:树中结点的最大层次;
堂兄弟结点:双亲在同一层的结点互为堂兄弟;
节点的祖先:从根到该结点所经分支上的所有结点
子孙:以某结点为根的子树中任一结点都称为该结点的子孙。
森林:由m(m>=0)棵互不相交的树的集合称为森林;
二叉树
定义
与树的区别
1. 树对于结点的度没有限制,而二叉树每个结点的度最大为2。
2. 树的结点可以无序,但二叉树结点有左右之分。
完全二叉树
我们不难发现,对于二叉树来说,每一层都有最大结点数量,比如第2层最多2个结点,第3层最多4个,第4层最多8个,第i层最多2i-1个。
完全二叉树的定义,就是假设树的高度为h,则除了第h层以外,每一层都达到了最大结点数,并且第h层的结点都是从左到右依次排列的,如图所示,除了(a),其他都不是完全二叉树:
满二叉树
满二叉树是完全二叉树的特殊情况,顾名思义就是对于高度为h的二叉树,每一层都“满了”,都达到了最大结点数量,如下图就是一棵满二叉树,当然,它也是完全二叉树:
二叉树的基本性质
1. 在非空二叉树中,第i层的结点总数不超过2i-1 ,i>=1;
2. 深度为h的二叉树最多有2h-1个结点(h>=1),最少有h个结点;
3. 对于任意一棵二叉树,如果其叶结点数为N0,而度数为2的结点总数为N2,则N0=N2+1;
4. 具有n个结点的完全二叉树的深度为log2(n+1)
5. 有N个结点的完全二叉树各结点如果用顺序方式存储,则结点之间有如下关系:
若I为结点编号则 如果I>1,则其父结点的编号为I/2;
(1) 如果2*I<=N,则其左儿子(即左子树的根结点)的编号为2*I;若2*I>N,则无左儿子;
(2) 如果2*I+1<=N,则其右儿子的结点编号为2*I+1;若2*I+1>N,则无右儿子。
6. 给定N个节点,能构成h(N)种不同的二叉树。h(N)为卡特兰数的第N项。h(n)=C(2*n,n)/(n+1)。
7. 设有i个枝点,I为所有枝点的道路长度总和,J为叶的道路长度总和J=I+2i[4]
下集预告&传送门:数据结构与算法专题之树——二叉树的遍历及应用