数据结构和算法(十)之树结构
一. 树的概念
我们先来简单的认识一些关于树的概念,再来认识特殊的二叉树以及它的相关编码工作。
树是什么?
-
真正的树:
-
相信每个人对现实生活中的树都会非常熟悉
-
我们来看一下树有什么特点?
- 树通常有一个根。连接着根的是树干。
- 树干到上面之后会进行分叉成树枝,树枝还会分叉成更小的树枝。
- 在树枝的最后是叶子。
-
树的抽象:
- 专家们对树的结构进行了抽象,发现树可以模拟生活中的很多场景。
-
-
模拟树结构
-
公司组织架构:
-
红楼梦家谱
-
-
我们再将里面的数据移除,仅仅抽象出来结构,那么就是我们要学习的树结构
树的优点
- 我们之前已经学习了多种数据结构来保存数据,为什么要使用树结构来保存数据呢?
- 树结构和数组 / 链表 / 哈希表的对比有什么优先呢?
- 数组:
- 优点:
- 数组的主要优点是根据下标值访问效率会很高。
- 但是如果我们希望根据元素来查找对应的位置呢?
- 比较好的方式是先对数组进行排序,再进行二分查找。
- 缺点:
- 需要先对数组进行排序,生成有序数组,才能提高查找效率。
- 另外数组在插入和删除数据时,需要有大量的位移操作(插入到首位或者中间位置的时候),效率很低。
- 优点:
- 链表:
- 优点:
- 链表的插入和删除操作效率都很高。
- 缺点:
- 查找效率很低,需要从头开始依次访问链表中的每个数据项,直到找到。
- 而且即使插入和删除操作效率很高,但是如果要插入和删除中间位置的数据,还是需要重头先找到对应的数据。
- 优点:
- 哈希表:
- 优先:
- 我们学过哈希表后,已经发现了哈希表的插入 / 查询 / 删除效率都是非常高的。
- 但是哈希表也有很多缺点。
- 缺点:
- 空间利用率不高,底层使用的是数组,并且某些单元是没有被利用的。
- 哈希表中的元素时无序的,不能按照固定的顺序来遍历哈希表的元素。
- 不能快速的找出哈希表中的最大或者最小值这些特殊的值。
- 优先:
- 树结构:
- 我们不能说树结构比其他结构都要好,因为每种数据结构都有自己特定的应用场景。
- 但是树确实也综合了上面的数据结构的优点(当然优点不足于盖过其他数据结构,比如效率一般情况下没有哈希表高),并且也弥补了上面数据结构的缺点。
- 而且为了模拟某些场景,我们使用树结构会更加发的那个方便。比如文件的目录结构。
树的术语
-
在描述树的各个部分的时候有很多术语。
- 为了让介绍的内容更容易理解,需要知道一些树的术语。
- 不过大部分术语都与真实世界的树相关,或者和家庭关系相关(如父节点和子节点),所以他们比较容易理解。
-
我们先来看一下树的结构
-
树的定义:
- 树
(Tree):n (n>=0)
个结点构成的优先集合。- 当
n=0
时,称为空树; - 对于任一棵非空树(
n>0
),它具备以下性质 - 树中有一个称为“根(
Root
)”的特殊结点,用r
表示; - 其余结点可分为
m(m>0)
个互不相交的有限集合T1,T2,...,Tm
,其中每个集合本身又是一棵树,称为原来树的“子树(SubTree
)”
- 当
- 注意:
- 子树之间不可以相交
- 除了根结点外,每个结点有且仅有一个父结点;
- 一棵
N
个结点的树有N-1
条边。
- 树
-
树的术语:
- 结点的度(
Degree
):结点的子树个数。 - 树的度:树的所有结点中最大的度数。(树的度通常为结点的个数
N-1
) - 叶节点(
Leaf
):度为0
的结点。(也称为叶子结点) - 父结点(
Parent
):有子树的结点是其子树的根结点的父结点。 - 子结点(
Child
):若A
结点是B
结点的父结点,则称B
结点是A
结点的子结点;子结点也称孩子结点。 - 兄弟结点(
Sibing
):具有同一父结点的各结点彼此是兄弟结点。 - 路径和路劲长度:从结点
n1
到nk
的路径为一个结点序列n1,n2,...,nk,ni
是ni+1
的父结点,路径包含边的个数为路径的长度。 - 结点的层次(
Level
):规定根结点在1
层,其他任意结点的层数是其父结点的层数加1. - 树的深度(
Depth
):树中所有结点中的最大层次是这棵树的深度。
- 结点的度(
树的表示
-
树可以有多种表示的方式。
-
最普通的表示方式:
-
儿子 - 兄弟表示法
-
儿子 - 兄弟表示法旋转
-
你发现上面规律了吗?
- 其实所有的树本质上都可以使用二叉树模拟出来。
- 所以在学习树的过程中,二叉树非常重要。
二. 二叉树
如果树中每个结点最多只能有两个结点,这样的树就称为“二叉树”。
前面,我们已经提过二叉树的重要性,不仅仅是因为简单,也因为几乎上所有的树都可以表示成二叉树的形式。
二叉树的概念
-
二叉树的定义
- 二叉树可以为空,也可以没有结点。
- 若不为空,则他是由根结点和称其为左子树
TL
和右子树TR
的两个不相交的二叉树组成。
-
二叉树有五种形态:
- 注意
c
和d
是不同的二叉树,因为二叉树是有左右之分的。
- 注意
二叉树的特性
-
二叉树有几个比较重要的特性,在笔试题中比较常见:
-
一个二叉树第
i
层的最大结点树为: 2 i − 1 2^{i-1} 2i−1, i > = 1 i>=1 i>=1; -
深度为
k
的二叉树有最大结点总数为: 2 k − 1 2^k - 1 2k−1, k > = 1 k>=1 k>=1 -
对任何非空二叉树
T
,若n0
表示叶节点的个数、n2
是度为2的非叶结点个数,那么两者满足关系n0 = n2 + 1
。
-
特殊二叉树
-
完美二叉树(
Perfect Binary Tree
),也称为满二叉树(Full Binary Tree
)- 在二叉树中,除了最下一层的叶结点外,每层结点都有个子结点,就构成了满二叉树。
-
完全二叉树(
Complete Binary Tree
)- 除二叉树最后一层外,其他各层的结点数都达到最大个数。
- 且最后一层从左向右的叶结点连续存在,只缺右侧若干结点。
- 完美二叉树是特殊的完全二叉树。
-
下面不是完全二叉树,因为
D
结点还没有右结点,但是E
结点就有了左右结点。
二叉树的存储
-
二叉树的存储常见的方式是数组和链表。
-
使用数组存储:
-
完全二叉树:安从上至下、从左到右顺序存储
-
非完全二叉树:
- 非完全二叉树要转成完全二叉树才可以按照上面的方案存储。
- 但是会造成很大的空间浪费
-
-
链表存储:
- 二叉树最常见的方式还是使用链表存储。
- 每个结点封装成一个
Node
,Node
中包含存储的数据,左结点的引用,右结点的引用。