本文通过图文介绍Huffman树的构成,重点在于理解Huffman树的形成原理,另外给出Huffman树的参考代码。之后通过文本压缩的例子来介绍Huffman编码,本文将从以下几个方面来介绍:
- 什么是Huffman树
- 案例介绍Huffman树的构成
- Huffman编码
- Huffman编码的应用
什么是Huffman树
Huffman树是一种树状的数据结构。任何一种数据结构都是用来解决特定的问题,那么首先我们先来弄出清楚Huffman树解决什么样的问题?
现在有一些不同数值的节点(图中蓝色),要把这些节点构成一颗二叉树,而每个节点所在的层数就是这个节点权重,现在要求构成的二叉树所有节点的加权之和要最小。直观上应该是节点数值越大的层数越小,也就是离根节点越近。
霍夫曼树又称最优二叉树,是一种带权路径长度最短的二叉树1 。所谓树的带权路径长度,就是树中所有的叶结点的权值乘上其到根结点的路径长度(若根结点为0层,叶结点到根结点的路径长度为叶结点的层数)。树的路径长度是从树根到每一结点的路径长度之和,记为:
W P L = ( W 1 ∗ L 1 + W 2 ∗ L 2 + W 3 ∗ L 3 + . . . + W n ∗ L n ) WPL =(W_1*L_1+W_2*L_2+W_3*L_3+ ...+W_n*L_n) WPL=(W1∗L1+W2