一、哈夫曼树
哈夫曼树中只有度为0和2的结点
在有n个叶子结点的哈夫曼树中,
非叶子结点的总数(n-1)
解释:N个叶子结点说明哈夫曼树需要处理的数据个数是n,然后N个数据元素进行整合,整合一次导致变化;
数据元素-1(从结点中选出的2个权值最小的,在合成一个非叶子结点;即-2+1=-1)
哈夫曼树的非叶子结点+1
1.1哈夫曼树(最优二叉树)的定义
在含有n个带权叶结点的二叉树中,其中带权路径长度(WPL)最小的二叉树称为哈夫曼树,也称为最优二叉树
1.2带权路径长度
结点的权:
树中结点常常被赋予一个表示某种意义的数值,称为该结点的权
结点带权路径长度:
从树的根到任意结点的路径长度(经过的边数)与该结点上权值的乘积
树的带权路径长度(WPL)
树中所有叶结点
(注意不包括非叶子结点
)的带权路径长度之和称为该树的带权路径长度,记做:
1.3哈夫曼树的构造
哈夫曼树(最优二叉树):在含有给定的n个带权叶结点的二叉树中,WPL最小的二叉树
哈夫曼树:每次选两个根结点权值最小的树进行合并,并将二者权值之和作为新的根节点的权值
哈夫曼树不唯一,但WPL必然都是最小值
- 将这n个结点分别作为n颗树仅含一个结点的二叉树,构成森林
- 构造一个新结点,从F中选取两颗根结点权值最小的树作为新结点的左、右子树,并且将新结点的权值置为左、右子树上根结点的权值之和
- 从F中删除刚刚选出的两颗树,同时将新得到的树加入到F
- 重复2、3,直到F中只剩下一颗树
二、哈夫曼编码(产生的是最短前缀码)
将字符频次作为字符结点权值,构造哈夫曼树,即得到哈夫曼编码,可用于数据压缩
-
前缀编码:没有一个编码是另外一个编码的前缀
以下就是一个前缀编码
以下是非前缀编码,因为A是1,是B是111,是B的前缀
-
固定长度编码:每个字符用相等长度的二进制位表示
-
可变长度编码:允许对不同字符用不等长的二进制位表示
三、查并集(树与等价的问题)
并查集是一种简单的集合表示,支持以下三种操作:
通常用树(森林)的双亲表示作为并查集的存储结构,每个子集以一棵树表示。所有表示子集合的树,构成表示全集合的森林,存放在双亲表示数组内。
通常以数组元素的下标表示元素名,用根节点的下标表示集合名,根结点的双亲结点为负数