哈夫曼树的应用
题目2:
要传输一则报文内容如下:
“AAAAAAAAAAAAAAABBBBBBBBBCCCCCCCCDDDDDDDDDDDDEEEEEEEEEEFFFFF”
请为这段报文设计哈夫曼编码,要求如下:
- 请计算出每个字符出现的概率,并以概率为权重来构造哈夫曼树,写出构造过程、画出
最终的哈夫曼树,得到每个字符的哈夫曼编码。 - 请将上述设计哈夫曼编码的过程,用代码来实现,并输出各个字母的哈夫曼编码。(有
代码,有运行结果的截图) - 请分析算法的效率,至少包括时间复杂度和空间复杂度等。
一.构造原理
(1)
报文由59个字符组成,所以报文字符总数为59,报文字符的种类有6种,每种字符的频数和概率(保留两位小数)如图1所示:
图1
(2)
构造过程:
1.根据给定的n个权值{w1,w2,…,.wn}构成n棵二叉树的集合F={T1,T2,…,Tn},其中每棵二叉树Ti 中只有一个带权为wi根结点,其左右子树均为空。
图2
2.在F中选取两棵根结点的权值最小的树作为左右子树构造一棵新的二叉树,且置新的二叉树的根结点的权值为其左右子树上根结点的权值之和。
3.在F中删除这两棵树,同时将新得到二叉树加入F中。
4.重复2和3步骤,直到F只含一棵树为止。如图3所示这棵树便是哈夫曼树。
图3
对上述的哈夫曼树,将其树中每个结点左分支赋0、右分支赋1,则从根结点开始到叶子结点,得到的一个二进制串,即为该字符的哈夫曼编码。
图4
(3)
由图4知
A字符的编码为10
B字符的编码为110
C字符的编码为011
D字符的编码为00
E字符的编码为111
F字符的编码为010
二. 代码编写
编译环境:Sublime Test 3.2.2 Build 3211,代码如下:
(1)
#include<stdio.h>
#include<stdlib.h>
#define MAXBIT 100
#define MAXLEAF 50
#define MAXNODE MAXLEAF*2-1
#define MAXQZ 99999//权重
typedef struct
{
int bit[MAXBIT];
int start;
}HCodeType;//编码结构体
typedef struct
{
int weight;
int parent;
int lchild;
int rchild;
char value;
}HNode;//结点结构体
void HuffmanTree(HNode HuffNode[MAXNODE],int n)//构造哈夫曼树
{
int i=0,j,m1,m2,x1,x2;
char x;
printf("请输入每种报文字符\n"