树的定义
线性表、栈、队列都是线性结构,而树是一种非线性结构。树是n个结点的有限集,当n=0时,成为空树。
树的存储方法
1.双亲表示法
假设以一组连续空间存储树的结点,同时在每个结点中,附设一个指示其双亲结点在数组中位置的元素。也就是说,每个结点除了知道自己是谁之外,还知道它的parent在哪里。这样的存储结构,可以根据某结点的parent指针找到它的双亲结点,所用的时间复杂度是O(1),索引到parent的值为-1时,表示找到了树结点的根。但是如果要知道某结点的孩子是什么,需要遍历整个树结构。然而,总是有更方便的方法,也就是对一个结点可以记录下其parent和son以及兄弟结点的位置。
2.孩子表示法
由于树中的每个结点可能有多棵子树,可以考虑用多重链表来实现。
3.双亲孩子表示法
二叉树
在计算机科学中,二叉树是每个结点最多有两个子树的树结构,因此二叉树的度不会超过2。通常子树被称作“左子树”(left subtree)和“右子树”(right subtree),左子树和右子树是有顺序的,次序不能颠倒。即使树种某节点只有一颗子树,也要区分它是左子树还是右子树。二叉树常被用于实现二叉查找树和二叉堆。
- 空二叉树
- 只有一个根节点的二叉树
- 根节点只有左子树的二叉树
- 根节点只有右子树的二叉树
- 根节点既有左子树又有右子树
特殊二叉树:主要由斜树组成。
满二叉树:如果所有分支结点都存在左子树和右子树,并且所有叶子都在同一层上,这样的二叉树称为满二叉树。
完全二叉树:完全二叉树是效率很高的数据结构,完全二叉树是由满二叉树而引出来的。对于深度为K的,有n个结点的二叉树,当且仅当其每一个结点都与深度为K的满二叉树中编号从1至n的结点一一对应时称之为完全二叉树。
二叉树的存储结构
完全二叉树和满二叉树都可以通过数组来表现出逻辑结构,此时层序编号可以反映出逻辑关系,可以利用顺序存储结构。但是对一般二叉树来说,比如极端的斜树,此时层序编号不能反映出逻辑关系,这时需要利用链式存储。
二叉树每个结点最多由两个孩子,所以为它设计一个数据域和两个指针域是比较自然的想法,称这样的链表叫做二叉链表。
二叉树的遍历
按照某种次序依次访问二叉树种所有结点,使得每个结点被访问一次,且仅被访问一次。
二叉树的遍历方法:
- 前序遍历
- 中序遍历
- 后序遍历
- 层序遍历
前序遍历:
若二叉树为空,则空操作返回,否则先访问根节点,然后前序遍历左子树,再前序遍历右子树。
中序遍历:
若树为空,则空操作返回,否则从根节点开始(注意并不是先访问根节点),中序遍历根节点的左子树,然后是访问根节点,最后中序遍历右子树。
后序遍历:
若树为空,则空操作返回,否则从左到右先叶子后结点的方式遍历访问左右子树,最后访问根节点。
层序遍历:
顾名思义就是按层来每次遍历,结点。
线索二叉树
n个结点的二叉链表中含有n+1(2n-(n-1)=n+1)个空指针域。利用二叉链表中的空指针域,存放指向结点在某种遍历次序下的前驱和后继结点的指针(这种附加的指针称为"线索")。
树、森林及而二叉树的相互转换
普通树转换成二叉树:
- 在树中所有的兄弟结点之间加一连线
- 对每个结点,除了保留与其长子的连线外,去掉该结点与其他孩子的连线
森林转换为二叉树:
- 先将森林中的每棵树变为二叉树
- 再将各二叉树的根节点视为兄弟从左到右连在一起,就形成了一棵二叉树
二叉树到树、森立的转换:
- 若结点x是其双亲y的左孩子,则把x的右孩子,右孩子的右孩子,。。。,都与y用连线连起来。
- 去掉所有双亲到右孩子之间的连线。
树与森林的遍历
树的遍历分为两种方式:一种是先根遍历,另一种是后根遍历。
森林的遍历也分为前序遍历和后序遍历,其实就是按照树的先根遍历和后跟遍历依次访问森林的每一颗树。树、森林的前根遍历和二叉树的前序遍历结果相同,树、森林的后跟遍历和二叉树的中序遍历结果相同。这时对树和森林遍历这种复杂问题的简单解决方案。
赫夫曼树
在数据膨胀、信息爆炸的今天,数据压缩的意义不言而喻。谈到数据压缩,就不能不提赫夫曼编码,这是首个实用的压缩编码方案,即使今天的许多知名压缩算法里,依然可以见到赫夫曼编码的影子。
我们先把两棵二叉树简化成叶子结点带权的二叉树(注:树节点间的连线相关的数叫做权)。
赫夫曼编码
定长编码:像ASCII编码
变长编码:单个编码的长度不一致,可以根据整体出现频率来调节
前缀码:所谓的前缀码,就是没有任何码字是其它码字的前缀