哈夫曼编码是一种不等长编码,常用字符编码短,不常用字符编码长。
不等长编码需要解决两个关键问题:
(1)编码尽可能短(最长的编码最短)
(2)不能有二义性(前缀码特性:一个编码不能是另一个编码的前缀)
具体操作:
在树的分支上编码,字符都放在叶子结点,从根走向叶子的路径上的编码即为该对象的编码。(以叶子结点为编码对象解决了前缀码特性)
将字符出现的频率作为叶子的权值,刚开始为全部为单节点的树的集合,每次取出权值最小的两个树进行合并,合并后权值为两树权值之和,合并后再插入树的集合,按同样的方式进行n-1次合并。(权值大的离根近)
从叶子节点自下而上查询编码,倒序输出。
可变基哈夫曼编码
可变基哈夫曼编码指二叉树变为了R叉树