目录
一、前情提要
前面几篇所讲到的,链表、栈、队列,那都是线性结构。但是在现实中,还有很多一对多的=情况需要处理,所以我们需要研究这种一对多的数据结构——“树”,考虑到它的各种特性,来解决我们编程中所出现的问题。
二、树的概念介绍
定义:树(Tree)是n(n>=0)个结点的有限集。当n==0的时候,我们称之为空树。在任意一棵非空树中,有几个特点:
(1)有且仅有一个特定的称为根(Root)的结点。
(2)当n>1时,其余结点可以分为m个互不相交的有限集,T1,T2,T3....Tm,其中每一个集合本身又是一棵树,并且被称为根的子树(SubTree)。
乍一看定义很长,看起来很懵。不急,咱一句句解释。
第一句“树(Tree)是n(n>=0)个结点的有限集。” ,这里重点是有限集,首先它是一个集合,集合里面装的啥?装的是n个结点。并且结点的数量是有限的,所以称之为n个结点的有限集。
第二句,“当n==0的时候,我们称之为空树”。这个好理解,一个点都没,不就是空树嘛。
第一个特点,“有且仅有一个特定的称为根(Root)的结点。”,我们画个图就好理解了。
红色框内的结点就是根节点。
第二个特点,“当n>1时,其余结点可以分为m个互不相交的有限集”,在上图中n==9,其余结点就是B,C,D,E,F,G,H,I(其余结点就是除开根结点)。可以分为m个互不相交的有限集。有限集咱解释过了,怎么分呢?看下图注释。
我们可以将其余结点分为3个部分,也就是图中的三个红框。这么分就保证了三个有限集互不相交,此时m==3。
最后一句“其中每一个集合本身又是一棵树,并且被称为根的子树(SubTree)。”,我们可以把三个框中的东西单独拿出来看,我们就拿T1来看吧。
仔细观察发现,T1其实也满足树的定义和特点。所以T1,也是一棵树。但这棵树是,以A为根结点的树的一部分,所以被称为根的子树(SubTree)。
可能会有人存在疑问,T2只有一个点C,它也是子树吗?
回答是肯定的,因为树的定义中,n的范围是n>=0的,T2中只有一个点,那就是n==1,符合树的定义,那就说明T2是一棵树,并且这棵树是,以A为根结点的树的一部分,所以也是根的子树。
对于树的定义再强调两点:
(1)n>0时根结点是唯一的,不可能存在多个根结点。
(2)m>0时,子树的个数没有限制,但是它们肯定互不相交。
下图中的结构就不符合树的定义,因为有子树相交:
三、结点的分类
树的结点包含一个数据元素及若干指向其子树的分支。结点拥有的子树数称为结点的度(Degree)。
例如:
这张图中: 结点A的度为3,结点B的度为2,结点C的度为0,结点D的度为3。
度为0的结点称为叶结点(Leaf)或者终端结点。度不为0的结点称为非终端结点或者分支结点。除根结点之外,分支结点也称为内部结点。
树的度是树内个节点的度的最大值。
例如上图中:整棵树的度==树内各结点的度的最大值。
树中结点的度最大的是:结点A和结点D的度,都等于3.
所以整棵树的度为3。
四、结点间的关系
结点的子树的根称为该结点的孩子(Child),相应的,该结点称为孩子的双亲结点(Parent)。
同一个双亲的孩子之间互称兄弟(Sibling)。结点的祖先是从根到该结点所经分支上的所有结点。反之,以某结点为根的子树中的任一结点都被称为该结点的子孙。
还是以这个图来举例:
对于E来说,B和A都是它的祖先。
对于B来说,E和F都是它的子孙。
五、树的其他相关概念
结点的层次(Level)从根开始定义起。根为第一层,根的孩子为第二层。若某结点再第l层,则其子树就在第l+1层。
另外再说一句,有的书上会说,根为第零层,从零开始计数。其实两种说法都没问题,为了后面说法统一,我就默认以根为第一层。
双亲再同一层的结点互为堂兄弟。
树中结点的最大层次称为树的深度(Depth)或高度。
例如下图中:
G、H、I与F是堂兄弟。
这棵树的高度为3,因为这棵树总共有三层。
如果将树中结点的各子树看成从左至右是有次序的,不能互换的,则称该树为有序树,否则称为无序树。
森林(Forest)是m(m>=0)棵互不相交的树的集合。
例如·
T1、T2、T3组成的集合就可以理解为森林。
注意:树是结点的有限集。森林是树的有限集。
最后我们来对比一下线性结构与树的结构:
线性结构:
(1)第一个数据元素:无前驱
(2)最后一个数据元素:无后继
(3)中间元素:一个前驱一个后继。
树结构:
(1)根结点:无双亲,且唯一。
(2)叶节点:无孩子,可以多个。
(3)中间结点:一个双亲多个孩子。