1.字符编码有两种方式:定长编码和变长编码。定长编码如ASCII码,每一个字符都是由固定长度的二进制数据表示的。变长编码时,字符是可以由不同长度的二进制数据表示的。在变长编码时,为了保证解码时能有唯一的解码结果,编码必须为前缀码。(前缀码:任何一个字符的编码都不是其他字符编码的前缀)
2.huffman编码思路:将要编码的字符做为二叉树的叶节点,根据其权重构造二叉树,二叉树根到叶节点的路径代表词叶节点字符的编码。明显huffman方法产生的编码是前缀码,因为任何两个由根到叶节点的路径A,B是不可能存在A属于B或B属于A情况的 ( 由于A,B叶节点不同,所以叶节点到其父节点的路径是肯定不会相同的 )。
3.huffman编码思想:刚开始初始化n颗只有一个节点的树。不断从存在的树中选择权值最小的两颗构造成一颗新树,同时取代最小的这两颗,直到树构造完成。
4.代码: