Huffman编码是二叉树的基本应用之一:将英文字母编辑成0、1的比特码,从而可以发送和接受0、1比特流。
一、那么该如何编码才能获得最高效率?共分两步:
1、以二叉树为结构,向左子树走代表0,向右子树走代表1,就这样0101……下去直到“叶节点”,每个叶节点即一个无重的编码。不但无重,还是“无重复的前缀”的,否则依然有歧义。
2、考虑词频,则更常用的字母应该对应更短的编码。Huffman树采用贪心算法,从词频最低的字母开始,自下而上的生成二叉树,并且新节点以子树的叶节点词频之和继续参与词频排序。
二、有了Huffman树,如何得到编码表?用前、中或后续遍历均可得到编码表,而层次遍历不记录祖先节点,不适用于此处。
三、有了Huffman树,如何解码(decode)?对接收到的编码从根节点开始向叶节点前进,当读取到叶节点时输出,并返回到根节点继续读取编码,直到编码结束。