问题
给定字符集C={x1,x2,…,xn}和每个字符集的频率f(x1),求关于C的一个最优前缀码。
解析
- 构造最优前缀码的贪心算法就是哈夫曼算法,根据各个字符的权值建立一颗哈夫曼树,求得每个字符的哈夫曼编码,有了每个字符的哈夫曼编码,我们就可以制作一个该字符集的哈夫曼编码表。有了字符集的哈夫曼编码表之后,对数据文件的编码过程就是依次读人文件中的字符ch,在哈夫曼编码表中找到此字符,将字符ch转换为对应的哈夫曼编码串。
核心代码
void buildHuffmanTree(int n){
for (int i=0; i<n*2-1; ++i) {
huffman[i].weight=0;
huffman[i].parent=-1;
huffman[i].leftchild=-1;
huffman[i].rightchild=-1;
}
for (int i=0; i<n; i++) {
printf("请分别输入第%d个哈夫曼字符和权重",i);
std::cin >> huffman[i].ch;
scanf("%d",&huffman[i].weight);
}
int x1,x2,w1,w2;
for (int i=0; i<n-1; i++) {
x1=x2=-1;
w1=w2=MAXWEIGHT;
for (int j=0; j<n+i; j++) {
if (huffman[j].parent==-1&&huffman[j].weight<w1) {
w2=w1;
x2=x1;
x1=j;
w1=huffman[j].weight;
}
else if (huffman[j].parent==-1&&huffman[j].weight<w2){
x2=j;
w2=huffman[j].weight;
}
}
huffman[n+i].leftchild=x1;
huffman[n+i].rightchild=x2;
huffman[n+i].weight=w1+w2;
huffman[x1].parent=n+i;
huffman[x2].parent=n+i;
}
}
时间复杂度
- O(nlogn)