树的概念
1.定义:
树(Tree)是n个结点的有限集,包括根节点与若干子树,子树又包括根结点与若干子树,是一个递归定义。n=0为空树。
2.树的其他表示方式:
嵌套集合、凹入表示、广义表。常用的是广义表。
3.基本术语
根结点:非空树中无前驱结点的结点
分支结点:度不为0, 非终端结点。
内部结点:除根结点之外的分支结点。
叶子:度为0的, 终端结点
孩子, 双亲:结点的子树的根称为该结点的孩子,该结点称为孩子的双亲
子孙,祖先:以某结点为根的子树中的任一结点都是子孙;从根到该结点所经分支上的所有结点都是祖先。
兄弟结点:有共同的双亲
堂兄弟:双亲在同一层的结点
结点的度:结点拥有的子树数
树的度:树内各结点的度的最大值
树的深度:树中结点的最大层次
有序树:树中结点的各子树从左到右有次序
无序树:树中结点的各子树无次序
森林:是m(m>=0)棵互不相交的树的集合
4.树结构与线性结构比较
二叉树的概念
二叉树结构简单、规律性强,所有树都可以转为唯一对应的二叉树。普通树运算复杂。
1.定义:
由一个根节点与两棵互不相交的二叉树形式的左子树与右子树组成。
2.特点:
每个结点最多有两个孩子,度<=2。
子树有左右之分,次序不能颠倒,颠倒了就是另一棵树。
二叉树可以是空集合,根可以有空的左子树或空的右子树。
二叉树不是树的特殊情况,它是独立的概念,强调左右位置。
3.五种基本形态
案例引入
1.数据压缩问题
求解不等长前缀码,用哈夫曼编码/哈夫曼树来实现。
2.利用二叉树求解表达式的值
优先运算的在较深的层。
二叉树的抽象数据类型定义
二叉树的类型定义:
二叉树的性质
性质1
在二叉树的第i层上至多有2
i
^i
i-
1
^1
1个结点,最少有1个结点。
性质2
深度为k的二叉树,整个树中至多有2
k
^k
k-1个结点,最少有k个结点。
性质3
对任意一颗二叉树T,如果叶子数为n
0
_0
0,度为2的结点数为n
2
_2
2,则n
0
_0
0=n
2
_2
2+1。
特殊形式的二叉树:(它们在顺序存储结构下可以复原)
满二叉树:一棵深度为k且有最多2
k
^k
k-1个结点的二叉树。每层都满,叶子结点全在最底层。满二叉树是完全二叉树的子集。
完全二叉树:就是结点都要堆积在左半边,不能有空着。叶子结点只能分布在层次最大的两层上。对任一结点,右子树的最大层次为i,则其左子树最大层数为i+1.
性质4
具有n个结点的完全二叉树的深度与结点的关系为:k=[log
2
_2
2n]+1
性质5
完全二叉树中结点i的双亲结点编号与孩子结点编号之间的关系。
找前驱与后继就是用这个性质。
二叉树的顺序存储
对每个结点位置进行编号(从上到下从左到右,无论有没有结点),并存放到数组中,某个位置没有结点就为零。
优点:都有编号,结点关系蕴含在存储位置中,可方便访问双亲和孩子。
缺点:顺序存储只适合存储满二叉树或完全二叉树。因为存储其他树很浪费空间。
二叉树的链式存储
1.二叉链表:
在n个结点的二叉链表中,有n+1个空指针域。
2.三叉链表
在二叉链表的基础上增加双亲结点指针域,共有三个指针域。
二叉树遍历方法
1.遍历定义:
2.遍历方法
主要研究三种方法:DLR、LDR、LRD
(1)先序遍历
(2)中序遍历
在判断左根右时,要把左、根、右各自看做整体来判断执行顺序。
左、右很可能是子树,不管是左还是右都需要跳过子树根结点,继续找到左最底。
(3)后序遍历
3.根据遍历序列确定二叉树
若二叉树中各结点值都不同,则先序序列、中序序列、后序序列都是唯一的。
由二叉树的先序序列+中序序列,或者后序序列+中序序列可以确定唯一二叉树。只有先序和后序才能确定根。
(1)先序序列+中序序列
由先序能确定根结点,然后在中序得到左右子树结点,再继续在先序找根结点,以此类推。注意先序排前面的肯定是根结点,不要放到左边去了。
(2)后序序列+中序序列