哈夫曼树:
- 解决的问题:如果根据节点的不同查找频率构造更有效的搜索树?
- 带权路径长度(WPL):设二叉树有n个子节点,每个叶子结点带有权值Wk,从根节点到每个叶子结点的长度为Ik,则每个叶子结点的带权路径长度之和就是WPL。
- 哈夫曼树(最优二叉树):WPL最小的二叉树。
哈夫曼树的特点:
没有度为1的节点。
n个叶子结点的Huffman树共有2n-1个结点。
Huffman的任意非叶结点的左右子树交换后仍是Huffman树。
对于同一组权值,存在不同构的两个Huffman树。
哈夫曼树的构造:
利用最小堆结构完成Huffman树的构造
typedef struct TreeNode* HuffmanTree;
struct TreeNode{
int weight;
HuffmanTree left, right;
};
HuffmanTree Huffman( MinHeap H )
{
int i;
HuffmanTree T;
BuildMinHeap(H);
for( i=1; i<H->size; i++)
{
T = malloc(sizeof(struct TreeNode));
T->left = DeleteMin(H);
T->right = DeleteMin(H);
T->weight = T->left->weight + T->right->weight;
Insert(H, T);
}
T = DeleteMin(H);
return T;
}
哈夫曼编码
引入:
- 前缀码(Profile code): 任何字符的编码都不是另一字符编码的前缀,从而解决二义性。
- 二叉树构造编码: 当所有字符都在叶子结点上时,且左右分支分别为0 、1,就可以保证前缀码。
正文:
- 解决问题 :如何对字符进行编码,可以使得该字符串的编码存储空间最小。
- 步骤: 先构造Huffman树,在以此编码。