1.问题
- 二元前缀码:任何字符的代码不能作为其他字符代码的前缀。
- 利用二元前级码译码:从第一个字符开始一次读入每个字符(0或1),如果发现读到的子串与某个码字相等,就将这个子串译作对应的码字;然后从下一个字符开始继续这个过程,直到读完输入的字符串为止。
- 二元前缀编码存储:二叉树结构,每个字符作为树叶,对应这个字符的前缀码看作根到这片树叶的一条路径,每个结点通向左儿子的边记作0,通向右儿子的边记作 1。
- 字符集合C={X1,X2,…,Xn}
- Xi的频率是f(Xi)
- d(Xi)表示字符Xi二进制位数,也就是Xi的码长
- 二元前缀编码:二叉树
- 码字:树叶
- 码字的二进制位数:树叶的深度
- 存储一个字符所使用的二进制数的平均值:B=∑ f(Xi)d(Xi)
- 最优二元前缀码:每个码字平均使用二进制位数最小的前缀码,称为最优二元前缀码。
- 问题:给定字符集C={X1,X2,…,Xn}和每个字符的频率f(Xi),求关于C的一个最优前缀码。
2.解析
利用哈夫曼算法(Huffman)构造最优前缀码。
例:
3.设计
算法