赫夫曼树的定义及构造,赫夫曼编码的定义及构造,算法实现和存储

一. 赫夫曼树(最优二叉树)

  1. 设二叉树具有n个带权值的叶子结点,从根结点到每一个叶子结点都有一个路径长度
  2. 从根结点到各个叶子结点的路径长度与相应结点权值的乘积的和称为该二叉树的带权路径长度,记作
    在这里插入图片描述
    其中,Wi为第i个叶子结点的权值,Li为 第i个叶子结点的路径长度。
    如:
    在这里插入图片描述
  3. 给定一组具有确定权值的叶子结点,可以构造出许多的二叉树。
    例如,用4个整数2,3,4,11作为4个叶子结点的权值,总共可以构造出120棵不同的二叉树,他们的带权路径长度可能不相同,把其中具有最小带权路径长度的二叉树称为赫夫曼树
    在这里插入图片描述

二. 构造赫夫曼树

  1. 根据赫夫曼树的定义,一棵二叉树要使其WPL值最小,必须使权值较大的叶子结点越靠近根结点。
  2. 而权值最小的叶子结点越远离根结点。
  3. 构造过程:
    ①. 由给定的n个权值{W1,W2,…,Wn}构造n棵只有一个根结点的二叉树,从而得到一个二叉树的集合F={T1,T2,…,Tn}。
    ②. 在F中选取根结点的权值最小和次小的两棵二叉树Ti,Tj 进行合并,即增加一个根结点,将Ti,Tj 分别作为它的左右子树,该根结点的权值为其左右子树根结点权值之和。
    ③. 重复步骤②,当F中只剩下一棵二叉树时,这颗二叉树便是所要建立的赫夫曼树。
    在这里插入图片描述

三. 赫夫曼编码

  1. 赫夫曼编码具有广泛的应用,利用赫夫曼树构造的用于通信的二进制编码称为赫夫曼编码
  2. 若要设计长短不等的编码,则必须是任一个字符的编码都不是另一个字符的编码的前缀,这种编码称为前缀编码

四. 构造赫夫曼编码

  1. 用给定的若干字符的频度为权值生成赫夫曼树,并在每个叶子上注明对应的字符。
  2. 树中从根到每个叶子都有一条路径,对路径上的各分支约定指向左子树根的分支表示“0”码,指向右子树的分支表示“1”码,取每条路径上的“0”或“1”的序列作为和各个叶子对应的字符的编码,这就是赫夫曼编码。
    在这里插入图片描述

五. 赫夫曼树和赫夫曼编码的存储表示

typedef struct{
	unsigned int weight;
	unsigned int parent,lchild,rchild;
}HTNode char *HuffmanTree;      //动态分配数组存储赫夫曼树
typedef char * *HuffmanCode;    //动态分配数组存储赫夫曼树编码表 

六. 求赫夫曼树和赫夫曼编码的算法

void HuffmanCoding(HuffmanTree &HT, HuffmanCode &HC, int *w, int n)
{//w存放n个字符的权值(均>0),构造赫夫曼树HT,并求出n个字符的赫夫曼编码HC 
	if(n<=1)
		return ;
	m=2*n-1;
	HT=(HuffmanTree)malloc((m+1)*sizeof(HTNode));  //0号单元未用
	for(p=HT, i=1; i<=n; ++i, ++p, ++w)
		*p={*w,0,0,0};
	for( ; i<=m; ++i, ++p)
		*p={0,0,0,0};
	for(i=n+1; i<=m; ++i)       //建赫夫曼树 
	{//在HT[l..i-1]选择parent为0,且weight最小的两个结点,其序号分别为上s1和s2 
		Select(HT,i-1,s1,s2);
		HT[s1].parent = i;
		HT[s2].parent = i;
		HT[i].lchild = s1;
		HT[i].rchild = s2;
		HT[i].weight = HT[s1].weight + HT[s2].weight;
	}
	
	
	
	//从叶子到根逆向求每个字符的赫夫曼编码
	Hc=(HuffmanTree)malloc((n+1)*sizeof(char * ));  //分配n个字符编码的头指针向量
	cd=(char * )malloc(n * sizeof(char));           //分配求编码的工作空间
	cd[n-1]="\0";        //编码结束符 
	for(i=1; i<=n; ++i)  //逐个字符求赫夫曼编码 
	{
		start=n-1;
		for(c=i, f=HT[i].parent; f!=0; c=f, f=HT[f].parent)//从叶子到根逆向求编码 
		{
			if(HT[f].lchild == c)
				cd[ - - start]="0";
			else
				cd[ - - start]="1";
		}
		HC[i]=(char * )malloc((n-start) * sizeof(char));//为第i个字符编码分批空间
		strcpy(HC[i],&cd[start]);  //从cd复制编码(串)到HC 
	}
	free(cd);       //释放工作空间 
} //HuffmanCoding 
  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值