树是一种极为重要极其常见的数据结构。从数据结构中数据元素之间的关系的角度来看,树表示的是一对多的关系。
一、基本概念
1.1 定义
从定义的角度讲,树(tree)是包含n(n>=0)个结点的有穷集合,其中:
- 每个数据元素称为被节点(node)
- 树中有且仅有一个没有前驱的特殊节点,该节点被称为树的根节点或者树根(root),所有其它节点都有且仅有一个前驱
- 没有后继的节点被称为树的叶子,除了叶子之外其它节点都至少有一个后继
- 除根结点之外的其余数据元素被分为m(m≥0)个互不相交的集合T1,T2,……Tm-1,其中每一个集合Ti(1<=i<=m)本身也是一棵树,被称作原树的子树(subtree)。
空集合也是树,称为空树。空树中没有结点。下图即为一个树形结构:
1.2 树的术语
树包含一些常用的术语如下:
- 节点的度:一个节点的直接后继的数目或者说子树的数目称为该节点的度
- 叶节点:没有后继的几点即度为0的节点称为叶节点,也被称为叶子
- 父节点:若一个节点含有子节点,则这个节点称为其子节点的父节点
- 子节点:一个节点含有的子树的根节点即直接后继称为该节点的子节点
- 兄弟节点:具有相同父节点的节点互称为兄弟节点
- 树的度:一棵树中,最大的节点的度称为树的度,上图中树的度为4
- 节点的层次:从根开始定义起,根为第1层,根的子结点为第2层,以此类推,上图中最大层次为5
- 树的高度或深度:树中节点的最大层次,上图中树的高度为5
- 堂兄弟节点:双亲在同一层的节点互为堂兄弟
- 节点的祖先:从根到该节点所经分支上的所有节点
- 子孙:以某节点为根的子树中任一节点都称为该节点的子孙
根据树中元素是否是有序的可以将树分为
- 无序树:树中任意节点的子结点之间没有顺序关系,这种树称为无序树
- 有序树:树中任意节点的子结点之间都遵循某种顺序关系,这种树称为有序树,因而它有很好的查找、删除、插入效率,因而也较常见
二、树的存储结构
2.1 孩子表示法
根据树的性质,一个节点有0个到多个孩子节点,根据前边的分析,只要有一棵树的根节点就可以根据每个节点的后继信息得到整棵树,因此每个节点的后继信息就很重要。做法是存储每个节点时不仅存储其数据信息,而且存储其后继的信息。由于每个节点的后继又称为其孩子节点,因此该方法又称为孩子表示法。
2.2 孩子兄弟表示法
如果采用孩子表示法,则没办法很快的找到一个节点的所有兄弟节点,为了可以很容易的找到每个节点的兄弟节点,可以对孩子表示法进行一点改造,做法是:每个结点的存储结构除了包含其数据信息之外还包含两个指针域,一个用于指向其第一个孩子,一个用于指向它的下一个兄弟节点。如果一个节点没有子节点或者已经是其兄弟节点中的最后一个,相应的指针域设置为NULL。在这种表示法中一个节点的所有子节点即互为兄弟节点的所有节点都通过节点的指向兄弟节点的指针连接到了一起。
用该方法表示孩子表示法中的树可以得到下图:
有时候可能想要根据孩子节点可以找到它的父节点,这就需要在节点中维护其父节点的信息。做法也很简单,只需要在节点数据结构中添加一个指向父节点的域即可。
三、递归算法及树的遍历
在树的所有操作中,遍历操作是一种比较特殊的操作,也是比较重要的一种操作,它可以基于树的基本概念工作而不依赖于添加在树上的限制(比如元素间是否有序,树的度为多少,任意一个节点的两个子树的高度差等邓),而其它的操作比如添加、删除、查找等操作或多或少都需要依赖于特定树类型添加在树的基本概念上的限制(比如在有序树上的查找、添加、删除都需要保证有序这个要求被满足,在二叉树上的这些操作要保证树是二叉的)。
树的遍历通常有两种方式:先根遍历,后根遍历。
3.1 递归算法
在计算机中存在一类问题,问题本身比较复杂,但是它可以被分解为小的同类问题(即可以用相同方法解决的规模较小的问题),如果规模小的问题被解决了原问题就解决了,对于这种问题是非常适合用递归算法类解决的,最典型的就是汉诺塔问题。
具体的来说,使用递归算法有如下要求:
- 每次递归调用在规模上都有所缩小,一般每次递归都会完成求解原问题的部分步骤,从而缩减了问题的规模
- 必须有递归的终止条件,通常是在问题规模小到可以直接给出答案时停止递归
3.2 先根遍历
先根遍历的定义为:- 先访问根结点;
- 再按照从左到右的顺序先根遍历根结点的每一棵子树。
由于任意一个节点的任意一个孩子都可以看做是以该孩子节点诶根的一棵树,因而可以说树是递归定义的。因此在遍历算法中可以采用递归算法,算法如下:
- 访问根节点
- 从左到右,如果存在某个孩子节点,就递归的遍历以它为根的子树
3.3 后根遍历
后根遍历的定义为:- 先按照从左到右的顺序后根遍历根结点的每一棵子树。
- 再访问根结点;
类似于先根遍历,后根遍历也可以很容易的用递归算法来实现:
- 从左到右,如果存在某个孩子节点,就递归的遍历以它为根的子树
- 访问根节点
3.4 层次遍历
层次遍历指的是按照树的层次依次遍历树的各层。层次遍历一般使用队列来辅助实现,其算法如下:
- 将树根入队
- 如果队列不为空则:
- 从队列中取出一个节点
- 访问该节点
- 将该节点的所有子节点依次入队
在树的存储中给出的树按照后根遍历可以得到:1,2,3,4,5,6,7,8,9,10,11。