关于赫夫曼编码的介绍

leafinsnowfield

于 2014-12-31 09:02:50 发布

阅读量2.4k

点赞数

分类专栏：上机考题目 c语言

313 篇文章 2 订阅

订阅专栏

20 篇文章 1 订阅

订阅专栏

--------------	a	b	c	d	e	f
Frequency (in thousands)	45	13	12	10	9	5
Fixed-length codeword	000	001	010	011	100	101
Variable-length codeword	0	101	100	111	1101	1100

如果某种编码方案中，没有一个编码会是其它编码的前缀，则称这种编码方案为前缀编码。有一条已证明的结论，任何由字符编码技术所获得的最佳压缩数据，也可以由前缀编码来获得。

前缀编码的编码很容易，只需将文件中的字符用对应的编码表示即可。解码也容易完成，因为其性质，可以直接从头至尾按编码与字符的对应关系翻译即可。

在解码过程中，为了方便和提高效率，可以用一颗二叉树来提供帮助。在这棵二叉树中，0表示往左走，1表示往右走。字符则被放置在树的叶子上。所以从根节点到叶子的路径表示了该字符的编码。这样一颗树对于解码时很有帮助的。下图是上面的例子中的两种编码对应的二叉树：

赫夫曼编码是指赫夫曼提供的一种构建最优前缀编码的方法。其方法是总选取权重最小的两个结点x和y合并成一个结点z,并用z代替它们，再从中选出两个权重最小的结点…如是反复。图解：

关注

专栏目录