1.问题
给定字符集C={x1,x2,…,xn}和每个字符的频率f(xi),求关于C的一个最优前缀码
2.解析
构造最优前缀码的贪心算法就是哈夫曼算法。将字符集作为森林,从中选出频率最低的两个字符,将这两个字符的合并成一棵新树,新树的根节点权值为两字符频率之和,从森林中删除这两个字符,将新树加入森林,重复直至全部合并为一颗树,即为所求的哈夫曼树。
3.设计
int huffman()
{
node x;
node y;
node z;
huffmanTop = maxNum;
while(heapSize> 1){
x = heapExtractMin();
y = heapExtractMin();
z.pos = huffmanTop;
huffmanLeft[z.pos] = x.pos;
huffmanRight[z.pos] = y.pos;
z.key = x.key + y.key;
f[z.pos] = f[x.pos] + f[y.pos];
minHeapInsert(z);
update(x.pos);
update(y.pos);
huffmanTop++;
}
z = heapExtractMin();
if(z.pos !=huffmanTop - 1)
{
int *a= (int *)0;
*a = 0;
printf(“error\n”);
}
returnz.pos;
}
4.分析
O(nlogn)频率排序;for循环O(n),插入操作O(logn)。算法复杂度是O(nlogn)
5.源码
https://github.com/xujinyuanky/-/blob/master/%E7%AE%97%E6%B3%95%E5%88%86%E6%9E%9011%20%E6%9C%80%E4%BC%98%E5%89%8D%E7%BC%80%E7%A0%81