1. 问题
代码(码字):Q {001,00,010,01}表示字符 a, b, c, d
同一序列:0100001
产生两种译码(产生歧义):01 00 001; 010 00 01
给定字符集C={x1,x2,…,xn}和每个字符的频率f(xi),求关于C的一个最优前缀码。
2. 设计
哈夫曼算法:
1)初始化n个单节点的树,每个字符的概率记在树的根中,用作树的权重。
2)找到两棵权重最小的树,把它们作为新树中的左右子树,并把权重和记作新的权重记录在新树的根中。
3)重复第二步直到只剩一颗单独的树。
3. 分析
O(nlogn)频率排序;for 循环 O(n),插入操作 O(logn),算法时间复杂度是 O(nlogn)
4. 源码
https://github.com/kekekeQWQ/11