Huffman树的概念
一些关于树的概念:
- 路径/路径长度:一棵树上一个点到另一个节点的通路称为路径,路径上分支(边)的个数称为路径长度。路径长度通常都是针对根节点而言,因此,设根节点层数为1,则从根节点到层节点路径长度为.
- 结点的权/带权路径长度:为树中的某个节点赋予一个值,则该值就为该节点的权。带权路径长度指的是:从根节点到该节点之间的路径长度与该节点权的乘积。
- 树的带权路径长度:树的所有叶子节点的带权路径长度之和。
- Huffman树(霍夫曼树/最优二叉树):给定n个权值作为n个叶子节点,则带权路径最小的树称为Huffman树。
Huffman树的构造
给定个权值作为二叉树的个叶子节点,则以此构造Huffman树的算法如下所示:
- 将看成是有棵树的森林(每棵树仅有一个节点)
- 从森林中选择两个根节点权值最小的树合并,作为一棵新树的左右子树,且新树的根节点权值为其左右子树根节点权值之和
- 从森林中删除被选中的两棵树,并且将新树加入森林
- 重复2-3步,知道森林中只有一棵树为止,则该树即所求的Huffman树
注意:按照上面算法构造的Huffman树可能不只有一种构型(例如,叶子节点为1,2,3,3),但是所有的构型的Huffman树的带权路径长度都是相同的。