算法分析与设计 作业11
问题
代码(码字):Q {001,00,010,01}表示字符 a, b, c, d
同一序列:0100001
产生两种译码(产生歧义):01 00 001; 010 00 01
二元前缀码:任何字符的代码不能作为其他字符代码的前缀
利用二元前缀码译码:从第一个字符开始一次读入每个字符(0 或 1),如果发现读到的子串与某个码字相等,就将这个子串译作对应的码字;然后从下一个 字符开始继续这个过程,直到读完输入的字符串为止。
给定字符集和每个字符的频率 ,求关于C的一个最优前缀码。
解析
构造最优前缀码的贪心算法,即哈夫曼算法。
1.初始化n个单节点的树,每个字符的概率记在树的根中,用作树的权重。
2.找到两棵权重最小的树,作为新树中的左右子树,并把权重和作为新的权重记录在新树的根中。
3.重复第二步直至所有的数据都变成哈夫曼树的叶子结点。
设计
For (int i=1;i<n;i++){
creat z;
z.left = C中最小元x;
z.right = C中最小元y;
z.weight=x.weight+y.weight;
insert(T,z); //将节点插入树T中
}
return T;
分析
时间复杂度 O(nlogn)
O(nlogn)频率排序;for 循环 O(n),插入操作 O(logn)
源码
github源码:
https://github.com/erha66666/algorithm_1-/tree/main/lab11