树是一种极为重要极其常见的数据结构。从数据结构中数据元素之间的关系的角度来看,树表示的是一对多的关系。

一、基本概念

1.1 定义

从定义的角度讲,树(tree)是包含n(n>=0)个结点的有穷集合,其中:

  • 每个数据元素称为被节点(node)
  • 树中有且仅有一个没有前驱的特殊节点,该节点被称为树的根节点或者树根(root),所有其它节点都有且仅有一个前驱
  • 没有后继的节点被称为树的叶子,除了叶子之外其它节点都至少有一个后继
  • 除根结点之外的其余数据元素被分为m(m≥0)个互不相交的集合T1,T2,……Tm-1,其中每一个集合Ti(1<=i<=m)本身也是一棵树,被称作原树的子树(subtree)。
树中的前驱、后继关系通常被称为父子关系。通过父子关系可以在树的结点之间建立一个层次结构。

空集合也是树,称为空树。空树中没有结点。下图即为一个树形结构:


1.2 树的术语

树包含一些常用的术语如下:

  • 节点的度:一个节点的直接后继的数目或者说子树的数目称为该节点的度
  • 叶节点:没有后继的几点即度为0的节点称为叶节点,也被称为叶子
  • 父节点:若一个节点含有子节点,则这个节点称为其子节点的父节点
  • 子节点:一个节点含有的子树的根节点即直接后继称为该节点的子节点
  • 兄弟节点:具有相同父节点的节点互称为兄弟节点
  • 树的度:一棵树中,最大的节点的度称为树的度,上图中树的度为4
  • 节点的层次:从根开始定义起,根为第1层,根的子结点为第2层,以此类推,上图中最大层次为5
  • 树的高度或深度:树中节点的最大层次,上图中树的高度为5
  • 堂兄弟节点:双亲在同一层的节点互为堂兄弟
  • 节点的祖先:从根到该节点所经分支上的所有节点
  • 子孙:以某节点为根的子树中任一节点都称为该节点的子孙

根据树中元素是否是有序的可以将树分为

  • 无序树:树中任意节点的子结点之间没有顺序关系,这种树称为无序树
  • 有序树:树中任意节点的子结点之间都遵循某种顺序关系,这种树称为有序树,因而它有很好的查找、删除、插入效率,因而也较常见

二、树的存储结构

树的存储可以采用顺序结构也可以采用链式结构,但是根据线性表中的分析,顺序存储的插入和删除效率较低,因而实际中多采用链式存储来表示树的存储结构。在存储树时,除了存储各个节点本身的数据信息之外,还需要保证存储结构能够表达节点之间的树形逻辑关系。
根据树的特点,只要我们拥有根节点的信息,就可以根据其后继信息找到树中的所有节点,同样的只要我们拥有了所有的叶子节点也就可以确保可以根据前驱信息找到树中的所有节点。但是很显然如果想要根据叶子找就必须维护所有叶子信息,而根据根节点找则只需要维护一个节点信息即可,因而树的实现中基本都是只维护一个根节点信息,并且采用链式存储结构。

2.1 孩子表示法

根据树的性质,一个节点有0个到多个孩子节点,根据前边的分析,只要有一棵树的根节点就可以根据每个节点的后继信息得到整棵树,因此每个节点的后继信息就很重要。做法是存储每个节点时不仅存储其数据信息,而且存储其后继的信息。由于每个节点的后继又称为其孩子节点,因此该方法又称为孩子表示法。
由于顺序存储不够灵活,因而实际中多采用链式存储,因此后继信息也是通过指针域来保存的。具体做法是在每个节点中除了存储该节点的数据信息之外还要包含多个指针域用于保存该节点的后继信息。
在这种表示法中指针域的数目取决于节点的度,由于树中每个节点的度可能不一样,因而每个节点所需的指针域的数目也不同,但是如果每个节点都根据其有多少个后继来决定其对应的节点数据结构应该包含多少个指针域会导致节点数据结构的管理变的复杂,因而实际中的做法往往所有节点的指针域的数目都等于树的度,如果某个指针域不指向一个真实存在的子节点,就将其设置为特殊的值(通常为NULL)。
二叉树、B树、红黑树等常见的树都采用了该表示方法。
一个使用该方式进行存储的树的图示如下所示(树的度为3,):


2.2 孩子兄弟表示法

如果采用孩子表示法,则没办法很快的找到一个节点的所有兄弟节点,为了可以很容易的找到每个节点的兄弟节点,可以对孩子表示法进行一点改造,做法是:每个结点的存储结构除了包含其数据信息之外还包含两个指针域,一个用于指向其第一个孩子,一个用于指向它的下一个兄弟节点。如果一个节点没有子节点或者已经是其兄弟节点中的最后一个,相应的指针域设置为NULL。在这种表示法中一个节点的所有子节点即互为兄弟节点的所有节点都通过节点的指向兄弟节点的指针连接到了一起。

用该方法表示孩子表示法中的树可以得到下图:



有时候可能想要根据孩子节点可以找到它的父节点,这就需要在节点中维护其父节点的信息。做法也很简单,只需要在节点数据结构中添加一个指向父节点的域即可。

三、递归算法及树的遍历

在树的所有操作中,遍历操作是一种比较特殊的操作,也是比较重要的一种操作,它可以基于树的基本概念工作而不依赖于添加在树上的限制(比如元素间是否有序,树的度为多少,任意一个节点的两个子树的高度差等邓),而其它的操作比如添加、删除、查找等操作或多或少都需要依赖于特定树类型添加在树的基本概念上的限制(比如在有序树上的查找、添加、删除都需要保证有序这个要求被满足,在二叉树上的这些操作要保证树是二叉的)。

树的遍历通常有两种方式:先根遍历,后根遍历。

3.1 递归算法

在计算机中存在一类问题,问题本身比较复杂,但是它可以被分解为小的同类问题(即可以用相同方法解决的规模较小的问题),如果规模小的问题被解决了原问题就解决了,对于这种问题是非常适合用递归算法类解决的,最典型的就是汉诺塔问题。

具体的来说,使用递归算法有如下要求:

  1. 每次递归调用在规模上都有所缩小,一般每次递归都会完成求解原问题的部分步骤,从而缩减了问题的规模
  2. 必须有递归的终止条件,通常是在问题规模小到可以直接给出答案时停止递归

3.2 先根遍历

先根遍历的定义为:
  • 先访问根结点;
  • 再按照从左到右的顺序先根遍历根结点的每一棵子树。
上边在树的存储中给出的树按照先根遍历可以得到:1,2,4,5,9,10,6,11,3,7。可以看出在遍历输出的序列中任意一棵子树的根都在其孩子节点之前。

由于任意一个节点的任意一个孩子都可以看做是以该孩子节点诶根的一棵树,因而可以说树是递归定义的。因此在遍历算法中可以采用递归算法,算法如下:

  1. 访问根节点
  2. 从左到右,如果存在某个孩子节点,就递归的遍历以它为根的子树
递归算法非常简洁,其缺点是递归过程会产生大量函数(过程、方法)调用从而消耗了较多的堆栈。

3.3 后根遍历

后根遍历的定义为:
  • 先按照从左到右的顺序后根遍历根结点的每一棵子树。
  • 再访问根结点;
上边在树的存储中给出的树按照后根遍历可以得到:4,9,10,5,11,6,2,7,3,1。可以看出在遍历输出的序列中任意一棵子树的根都在其孩子节点之后。

类似于先根遍历,后根遍历也可以很容易的用递归算法来实现:

  1. 从左到右,如果存在某个孩子节点,就递归的遍历以它为根的子树
  2. 访问根节点

3.4 层次遍历

层次遍历指的是按照树的层次依次遍历树的各层。层次遍历一般使用队列来辅助实现,其算法如下:

  1. 将树根入队
  2. 如果队列不为空则:
    1. 从队列中取出一个节点
    2. 访问该节点
    3. 将该节点的所有子节点依次入队

在树的存储中给出的树按照后根遍历可以得到:1,2,3,4,5,6,7,8,9,10,11。

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值