哈夫曼树与哈夫曼编码
什么是哈夫曼树(Huffman Tree)
定义:带权路径长度(WPL):设二叉树有n个叶子结点,每个叶子结点带有权值wk,从根结点到每个叶子结点的长度为lk,则每个叶子结点的带权路径长度之和就是:
最优二叉树或哈夫曼树:WPL最小的二叉树
例将百分制的考试成绩转换为五分制的成绩
判定树:
查找效率:比例*查找次数
修改判定树:
修改后的查找效率:
得出结论可以根据结点不同的查找频率构造更有效的搜索树
哈夫曼树的构造
每次把权值最小的两棵二叉树合并 形成一个新的结点
typedef struct TreeNode *HuffmanTree;
struct TreeNode{
int Weight;
HuffmanTree Left,Right;
}
HuffmanTree Huffman(MinHeap H)
{
/*假设H->Size个权值已经存在在H->Elements[]->Weight里*/
int i;HuffmanTree T;
BuildMinHeap(H);/*将H->Elements[]按权值调整为最小堆*/
for (i=1;i<H->Size;i++){/*做H->Size-1次合并*/
T=malloc(sizeof(struct TreeNode)); /*建立新的结点*/
T->Left=DeleteMin(H);/*从最小堆中删除一个结点,作为新T结点的左子结点*/
T->Right=DeleteMin(H);/*从最小堆中删除一个结点,作为新T结点的右子结点*/
T->Weight=T->Left->Weight+T->Right->Weight;/*计算新的权值*/
Insert(H,T);/*将新T插入到最小堆*/
}
T=DeleteMin(H);
return T;
}
哈夫曼编码
已经知道频率不一样,怎样编码效率最高
怎么进行不等长编码?
如何避免二义性?
前缀码:任何字符的编码都不是另一字符编码的前缀,可以无二义地编码
二叉树用于编码
(1)左右分支:0、1
(2)字符只在叶结点上
用二叉树来构造编码,只要对象在叶结点上就不会出现二义性
怎么构造一颗编码代价最小的二叉树?
构造一个哈夫曼树,对应上0、1