本文来介绍哈夫曼树。哈夫曼树又叫最优二叉树,是一种特殊的二叉树。这种二叉树最重要的特征就是:树的带权路径长度(Weighted Path Length of Tree,简记为WPL)最小。本文给出了哈弗曼算法的实现过程,代码部分已经描述的比较详细,这里就不再叙述了。
需要说明的是哈夫曼树的构造并不唯一,因为其左右子树位置交换,并不影响该二叉树的带权路径长度最小的性质。哈夫曼树有许多应用,比如说哈夫曼编码等等,哈夫曼编码将在我的下一篇博文中作简要介绍。
#include<cstdio>
#include<cstdlib>
#include<algorithm>
using namespace std;
#define n 5 //叶子数目
#define m 2*n-1 //树中结点总数
typedef struct{ //结点类型
double weight; //结点的权值
int parent,lchild,rchild;//双亲指针及左右孩子
}HTNode;
typedef HTNode HuffmanTree[m];//HuffmanTree是向量类型
typedef struct{ //用于SelectMin函数中排序的结点类型
int id; //保存根结点在向量中的序号
double weight; //保存根结点的权值
}temp;
void InitHuffmanTree(HuffmanTree T){
//初始化哈夫曼树
//将2n-1个结点里的三个指针均置为空(即置为-1),权值置为0
for(int i=0;i<m;i++){
T[i].lchild=-1;
T[i].rchild=-1;
T[i].parent=-1;
T[i].weight=0;
}
}
void InputWeight(HuffmanTree T){
//输入叶子权值
//读人n个叶子的权值存于向量的前n个分量中
for(int i=0;i<n;i++){
double x;
scanf("%lf",&x);
T[i].weight=x;
}
}
bool cmp(temp a,temp b){
//用于排序的比较函数
return a.weight<b.weight;
}
void SelectMin(HuffmanTree T,int k,int *p1,int *p2){
//在前k个结点中选择权值最小和次小的根结点,其序号分别为p1和p2
temp x[m]; //x向量为temp类型的向量
int i,j;
for(i=0,j=0;i<=k;i++){ //寻找最小和次小根节点的过程
if(T[i].parent==-1){//如果是根节点,则进行如下操作
x[j].id=i; //将该根节点的序号赋值给x
x[j].weight=T[i].weight;//将该根节点的权值赋值给x
j++; //x向量的指针后移一位
}
}
sort(x,x+j,cmp); //对x按照权值从小到大排序
//排序后的x向量的第一和第二个位置中存储的id是所找的根节点的序号值
*p1=x[0].id;
*p2=x[1].id;
}
void CreateHuffmanTree(HuffmanTree T){
//构造哈夫曼树,T[m-1]为其根结点
int i,p1,p2;
InitHuffmanTree(T); //将T初始化
InputWeight(T); //输入叶子权值
for(i=n;i<m;i++){
//在当前森林T[0..i-1]的所有结点中,选取权最小和次小的
//两个根结点T[p1]和T[p2]作为合并对象
//共进行n-1次合并,新结点依次存于T[i]中
SelectMin(T,i-1,&p1,&p2);//选择权值最小和次小的根结点,其序号分别为p1和p2
//将根为T[p1]和T[p2]的两棵树作为左右子树合并为一棵新的树
//新树的根是新结点T[i]
T[p1].parent=T[p2].parent=i;//T[p1]和T[p2]的两棵树的根结点指向i
T[i].lchild=p1; //最小权的根结点是新结点的左孩子
T[i].rchild=p2; //次小权的根结点是新结点的右孩子
T[i].weight=T[p1].weight+T[p2].weight;//新结点的权值是左右子树的权值之和
}
}
//*************************测试函数**********************************
int main(){
HuffmanTree T;
printf("请输入%d个叶子结点的权值来建立哈夫曼树:\n",n);
CreateHuffmanTree(T);
printf("哈夫曼树已经建好,输出如下:\n");
for(int i=0;i<m;i++){
printf("id:%d weight:%.1lf parent:%d",i,T[i].weight,T[i].parent);
printf(" lchild:%d rchild:%d\n",T[i].lchild,T[i].rchild);
}
return 0;
}
测试样例以及预测运行结果:
运行结果: