[数据结构 13] 树之概念

一、树的定义

1.1 定义

树(Tree)是 n(n>=0) 个结点的有限集。 n=0 时称为空树。在任意一棵非空树中,有且仅有一个特定的称为的结点。当 n>1 时,其余结点可分为 m (m>0) 个互不相交的有限集 T1、T2、……、Tm。其中每一个集合本身又是一棵树,并且称为根的子树(SubTree),如下图所示:

其中根结点 A 有两个子树:


1.2 节点分类

树的结点包含一个数据元素及若干指向其子树的分支。结点拥有的的子树数称为结点的度。度为 0 的称为叶结点或者终端结点;度不为 0 的结点称为非终端结点或者分支结点。除根结点之外,分支结点也称为内部结点。树的度是树内各结点的度的最大值。如下图所示,因为这棵树结点的度的最大值是结点 D 的度,为 3,所以树的度也为 3 。


1.3 结点间关系

结点的子树的根称为该结点的孩子(Child),相应地,该结点称为孩子的双亲(Parent) 。同一个双亲的孩子之间互称兄弟。结点的祖先是从根到该结点所经分支上的所有结点。所以对于 H 来说,D、B、A 都是它的祖先 。反之,以某结点为根的子树中的任一结点都称为该结点的子孙。B的子孙有 D、G、H、I,如下图所示:


1.4 结点的层次

结点的层次(Level)从根开始定义起,根为第一层,根的孩子为第二层,其双亲在同一层的结点互为堂兄弟。显然下图中的 D、E、F 是堂兄弟,而 G、H、丨、J 也是。树中结点的最大层次称为树的深度(depth),当前树的深度为4。

如果将树中结点的各子树看成从左至右是有次序的,不能互换的,则称该树为有序树,否则称为无序树

二、树的抽象数据类型

相对于线性结构,树的操作就完全不同了,这里我们给出一些基本和常用操作。

三、树的存储结构

我们这里要介绍三种不同的表示法:双亲表示法孩子表示法孩子兄弟示法

3.1 双亲表示法

我们假设以一组连续空间存储树的结点,同时在每个结点中,附设一个指示器指示其双亲结点在链表中的位置。也就是说,每个结点除了知道自己是谁以外,还知道它的双亲在哪里。它的结点结构为下图所示:

其中 data 是数据域,存储结点的数据信息。而 parent 是指针域,存储该结点的双亲在数组中的下标。以下是我们的双亲表示法的结点结构定义代码:

/* 树的双亲表示法的结点结构定义 */
#define MAX_TREE_SIZE 100
typedef int ElemType;  // 树结点的数据类型

typedef struct PTNode    //结点结构
{  
	ElemType data;
	int parent;       // 父结点位置
}PTNode;

typedef struct		  // 树结构
{
	PTNode nodes{MAX_TREE_SIZE};
	int r, n;         // 根结点位置,结点数
}Tree;

思路:由于根节点是没有双亲的,所以我们约定根节点的指针域设置为 -1。这也意味着我们所有节点都存有它双亲的位置。树结构和树双亲表示法如下所示:

这样的存储结构,我们可以根据结点的 parent 指针很容易找到它的双亲结点,所用的时间复杂度为 〇(1),直到 parent 为 -1 时,表示找到了树结点的根。

总结

优点:该存储方式根据结点的 parent 指针很容易找到它的双亲结点,时间复杂度为 O(1)。

缺点:如果需要知道某个结点的所有孩子,需要遍历整棵树。


3.2 孩子表示法

仔细观察,我们为了要遍历整棵树,把每个结点放到一个顺序存储结构的数组中是合理的,但每个结点的孩子有多少是不确定的,所以我们再对每个结点的孩子建立一个单链表体现它们的关系。

这就是我们要讲的孩子表示法。具体办法是,把每个结点的孩子结点排列起来, 以单链表作存储结构,则 n 个结点有 n 个孩子链表,如果是叶子结点则此单链表为空。然后 n 个头指针又组成一个线性表,采用顺序存储结构,存放进一个一维数组中,如下图所示:

为此,设计两种结点结构,一个是孩子链表的孩子结点,如下图所示。

其中 child 是数据域,用来存储某个结点在表头数组中的下标。next 是指针域,用来存储指向某结点的下一个孩子结点的指针。另一个是表头数组的表头结点,如下图所示:

其中 data 是数据域,存储某结点的数据信息。firstchild 是头指针域,存储该结点的孩子链表的头指针。

以下是我们的孩子表示法的结构定义代码:

/* 树的孩子表示法结构定义 */
#define MAX_TREE_SIZE 100
typedef int TElemType; 

typedef struct CTNode    //子结点结构
{
	struct CTNode *next;
	int child;
}CTNode, *ChildPtr;

typedef struct		   //表头结构
{
	TElemType data;
	ChildPtr firstchild;
}CTChain;

typedef struct		  //树结构
{
	CTChain nodes{ MAX_TREE_SIZE };
	int r, n;         //根结点位置,结点数
}Tree;

总结

缺点: 如果需要知道某个结点的双亲,需要遍历整棵树

改进:孩子兄弟表示法


3.3 孩子兄弟表示法

刚才我们分别从双亲的角度和从孩子的角度研究树的存储结构,如果我们从树结点的兄弟的角度又会如何呢?当然,对于树这样的层级结构来说,只研究结点的兄弟是不行的,我们观察后发现,任意一棵树,它的结点的第一个孩子如果存在就是唯一的,它的右兄弟如果存在也是唯一的。因此,我们设置两个指针,分别指向该结点的第一个孩子和此结点的右兄弟。

结点结构如下图所示:

其中 data 是数据域,firstchild 为指针域,存储该结点的第一个孩子结点的存储地址,rightsib 是指针域,存储该结点的右兄弟结点的存储地址。

孩子兄弟表示法的结构定义代码如下:

/* 树的孩子兄弟表示法结构定义 */
typedef struct CSNode
{
    TElemType data;
    struct CSNode *fristchild, *rightsib;
} CSNode, *CSTree;

这种方法实现的示意图如下图所示。

这种表示法,给查找某个结点的某个孩子带来了方便,只需要通过 fistchild 找到此结点的长子,然后再通过长子结点的 rightsib 找到它的二弟,接着一直下去,直到找到具体的孩子。当然,如果想找某个结点的双亲,完全可以再增加一个 parent 指针域来解决快速查找双亲的问题,这里就不再细谈了。

总结

优点: 可以把一棵复杂的树变成一棵二叉树,这样就可以充分利用二叉树的特性和算法来处理这棵树了。


参考:

《大话数据结构 - 第6章》 树

  • 15
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

高亚奇

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值