目的:领会哈夫曼树的构造过程以及哈夫曼编码的生成过程。
内容:编写一个程序exp7-2.cpp,构造一棵哈夫曼树,输出对应的哈夫曼编码和平均查找长度,并对表7.1所示的数据进行验证。
表7.1 单词及出现的频度
单词 | The | of | a | to | and | in | that | he | is | at | on | for | His | are | be |
出现频度 | 1192 | 677 | 541 | 518 | 462 | 450 | 242 | 195 | 190 | 181 | 174 | 157 | 138 | 124 | 123 |
//计算机 小淇在敲代码 构造哈夫曼树和生成哈夫曼编码
#include <stdio.h>
#include <string.h>
#define N 50 //叶子结点数
#define M 2*N-1 //树中结点总数
typedef struct
{
char data[5]; //结点值
double weight; //权重
int parent; //双亲结点
int lchild; //左孩子结点
int rchild; //右孩子结点
} HTNode;
typedef struct
{
char cd[N]; //存放当前结点的哈夫曼编码
int start; //表示cd[start..n0]部分是哈夫曼编码
} HCode;
//构造哈夫曼树
void CreateHT(HTNode ht[],int n0)
{
int i,k,lnode,rnode;
double min1,min2;
for (i=0;i<2*n0-1;i++) //所有节点的相关域置初值-1
ht[i].parent=ht[i].lchild=ht[i].rchild=-1;
for (i=n0;i<=2*n0-2;i++) //构造哈夫曼树的n0-1个节点
{ min1=min2=32767; //lnode和rnode为最小权重的两个节点位置
lnode=rnode=-1;
for (k=0;k<=i-1;k++) //在ht[0..i-1]中找权值最小的两个节点
if (ht[k].parent==-1) //只在尚未构造二叉树的节点中查找
{ if (ht[k].weight<min1)
{ min2=min1;rnode=lnode;
min1=ht[k].weight;lnode=k;
}
else if (ht[k].weight<min2)
{ min2=ht[k].weight;rnode=k; }
}
ht[i].weight=ht[lnode].weight+ht[rnode].weight;
ht[i].lchild=lnode;ht[i].rchild=rnode; //ht[i]作为双亲节点
ht[lnode].parent=i;ht[rnode].parent=i;
}
}
//构造哈夫曼树编码
void CreateHCode(HTNode ht[],HCode hcd[],int n0)
{ int i,f,c;
HCode hc;
for (i=0;i<n0;i++) //根据哈夫曼树求哈夫曼编码
{ hc.start=n0;c=i;
f=ht[i].parent;
while (f!=-1) //循环直到无双亲节点即到达树根节点
{ if (ht[f].lchild==c) //当前节点是双亲节点的左孩子
hc.cd[hc.start--]='0';
else //当前节点是双亲节点的右孩子
hc.cd[hc.start--]='1';
c=f;f=ht[f].parent; //再对双亲节点进行同样的操作
}
hc.start++; //start指向哈夫曼编码最开始字符
hcd[i]=hc;
}
}
//输出哈夫曼树编码
void DispHCode(HTNode ht[],HCode hcd[],int n0)
{
int i,k;
double sum=0,m=0;
int j;
printf("输出哈夫曼编码:\n"); //输出哈夫曼编码
for (i=0;i<n0;i++)
{
j=0;
printf(" %s:\t",ht[i].data);
for (k=hcd[i].start;k<=n0;k++)
{
printf("%c",hcd[i].cd[k]);
j++;
}
m+=ht[i].weight;
sum+=ht[i].weight*j;
printf("\n");
}
printf("\n 平均长度=%g\n",1.0*sum/m);
}
//主函数
int main()
{
int n=15,i; //n表示初始字符串的个数
char *str[]={"the","of","a","to","and","in","that","he","is","at","on","for","his","are","be"};
double fnum[]={1192,677,541,518,462,450,242,195,190,181,174,157,138,124,123};
HTNode ht[M];
HCode hcd[N];
printf("计算机 小淇在敲代码\n");
for (i=0;i<n;i++)
{
strcpy(ht[i].data,str[i]);
ht[i].weight=fnum[i];
}
printf("\n");
CreateHT(ht,n);
CreateHCode(ht,hcd,n);
DispHCode(ht,hcd,n);
printf("\n");
return 1;
}