构造哈夫曼树及输出哈夫曼编码

哈夫曼树的概念:

哈弗曼树又称为最优二叉树,它是由N个带权叶子结点构成的所有二叉树中带权路径长度(WPL)最短的二叉树。

权值分别为7524,构造有4个叶子结点的二叉树

哈夫曼树构造过程:

1、 根据给定的 n 个权值{ w 1 ,w 2 , …… w n } 构造 n 棵只有根结点的二叉树
2、 在森林中选取两棵根结点 权值最小的树作左右子树 ,构造一棵新的二叉树,置新二叉树根结点权值为其左右子树根结点权值之和。
3、 在森林中 删除这两棵树 ,同时将新得到的二叉树加入森林中。
4、 重复上述两步, 直到只含一棵树为止 ,这棵树即 哈夫 曼树。

哈夫曼编码的主要思想:

为出现次数较多的字符编以较短的编码。为确保对数据文件进行有效的压缩和对压缩文件进行正确的解码,可以利用哈弗曼树来设计二进制编码。

思维导图

实现代码

#include <stdio.h>
#include <stdlib.h>
#include<string.h>


/**********1. 哈弗曼树的存储表示***********/
typedef struct 
{
	int weight;//结点的权值
	int parent,lchild,rchild;//结点的双亲、左右孩子下标
}HTNode,*HuffmanTree;
/* 在HT中选择两个其双亲域为0且权值最小的结点,并返回它们在HT中的序号s1和s2*/

void Select(HuffmanTree HT,int len,int *s1,int *s2)
{
	int i,temp=0,max1=0x3f3f3f3f,max2=0x3f3f3f3f;//先赋予最大值
	for(i=1;i<=len;i++)
	{
		if(HT[i].weight<max1&&HT[i].parent==0)
		{
			
			max1=HT[i].weight;
			*s1=i;
		}
	}

	temp=HT[*s1].weight;//将权值使用temp先暂时存放起来,然后先赋予最大值,防止s1被重复选择,找到第二个较小权值的结点后再恢复原来的值
	HT[*s1].weight=0x3f3f3f3f;//赋予最大值
	for(i=1;i<=len;i++)
	{
		if(HT[i].weight<max2&&HT[i].parent==0)
		{
			max2=HT[i].weight;
			*s2=i;
		}
	}
	HT[*s1].weight=temp;//恢复原来的值
}

/*2. 构造哈弗曼树*/

HTNode * CreatHuffmanTree(int n)
{
	//构造赫夫曼树HT
	int m,s1=0,s2=0,i=0; //由n个结点构建的哈夫曼树共有m=2n-1个结点,s1和s2为结点在HT中的序号
	HTNode *HT;
	if(n<=1) return 0;
	m=2*n-1; //m赋初始值
	HT=(HTNode*)malloc((m+1) * sizeof(HTNode)); //0号单元未用,所以一共需要动态分配m+1(或者2*n)个单元,HT[m]表示根结点

	for(int i=1;i<=m;i++) //将1~m号单元中的双亲、左孩子,右孩子的下标都初始化为0
	   {
	    	HT[i].parent=0;
			HT[i].lchild=0;
			HT[i].rchild=0;
}
	printf("请输入叶子结点的权值:\n");
	for(i=1;i<=n;++i)        	
		scanf("%d",&HT[i].weight); //输入前n个单元中叶子结点的权值
	/*――――――――初始化工作结束,下面开始创建赫夫曼树―――――――――*/
	for(i=n+1;i<=m;++i)
		{  	//通过n-1次的选择、删除、合并来创建赫夫曼树
			Select(HT,i-1,&s1,&s2); //在HT[k](1≤k≤i-1)中选择两个其双亲域为0且权值最小的结点,并返回它们在HT中的序号s1和s2
			HT[s1].parent=i;
			HT[s2].parent=i;    //得到新结点i,从森林中删除s1,s2,将s1和s2的双亲域由0改为i	
			HT[i].lchild=s1;
			HT[i].rchild=s1;
			HT[i].rchild=s2;//s1,s2分别作为i的左右孩子
			HT[i].weight=HT[s1].weight + HT[s2] .weight;//i 的权值为左右孩子权值之和
	}
	return HT;	
	free(HT);									
	}							




char * *  CreatHuffmanCode(HuffmanTree HT,int n)
{
	//从叶子到根逆向求每个字符的赫夫曼编码,存储在编码表HC中
	int i,start,c,f;
	char * *HC;
	char * cd;
	                 				//分配n个字符编码的头指针矢量
	HC=(char * *)malloc((n+1)*sizeof(char *));
	         						//分配临时存放编码的动态数组空间
	cd=(char *)malloc(n*sizeof(char));
	cd[n-1]='\0';                            		//编码结束符
	for(i=1;i<=n;++i)
	{                      					//逐个字符求赫夫曼编码
		start=n-1;                          	//start开始时指向最后,即编码结束符位置
		c=i;
		f=HT[i].parent;                		//f指向结点c的双亲结点
		while(f!=0)
		{                          		//从叶子结点开始向上回溯,直到根结点
			                         		//回溯一次start向前指一个位置
		--start;	
		if(HT[f].lchild==c)	cd[start]='0';       //如果结点c是f的左孩子,则生成代码0
		else cd[start]='1';	               //否则结点c是f的右孩子,则生成代码1
			c=f;
			f=HT[f].parent;			            		//继续向上回溯
		}                                  		//求出第i个字符的编码
		HC[i]=(char *)malloc((n-start)*sizeof(char));       // 为第i 个字符编码分配空间
		strcpy(HC[i], &cd[start]);      //将求得的编码从临时空间cd复制到HC的当前行中
	}
	free (cd);
	return HC;                            		//释放临时空间
}





int main()
{
  	HuffmanTree HT;
  	char **HC;
	int n,i;
	printf("请输入叶子结点的个数:\n");	
	scanf("%d",&n);
	HT=CreatHuffmanTree(n);  // 调用 CreatHuffmanTree()函数,实参为n ,构建哈夫曼树
	printf("哈夫曼树建立完毕!\n");
	printf("每个结点的权值为:");
	for(i=1;i<=2*n-1;i++)
		printf("%d ",HT[i].weight);//输出每个结点的权值 HT[i].weight
	printf("\n");
	HC=CreatHuffmanCode(HT,n);
		for(i=1;i<=n;i++)
		{
		printf("权值为:");
	    printf("%d ",HT[i].weight);
		printf("的编码为:");
		printf("%s",HC[i]);
		printf("\n");
		}
	    printf("\n");
	
	return 0;
}

运行结果如下

  • 11
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
以下是构造哈夫曼树并根据哈夫曼树构造哈夫曼编码的步骤和示例代码: 1. 统计每个字符出现的频率,并将它们存储在一个字典中。 2. 将每个字符及其频率作为一个节点,构造一个森林。 3. 从森林中选出两个频率最小的节点,将它们合并成一个新节点,并将新节点的频率设置为两个节点的频率之和。将新节点插入森林中。 4. 重复步骤3,直到森林中只剩下一个节点,这个节点就是哈夫曼树的根节点。 5. 根据哈夫曼树构造哈夫曼编码。从根节点开始,遍历哈夫曼树,当遇到左子树时,在编码的末尾添加0,当遇到右子树时,在编码的末尾添加1。当遍历到叶子节点时,就得到了该字符的哈夫曼编码。 以下是示例代码: ```python # 定义节点类 class Node: def __init__(self, freq, char=None): self.freq = freq self.char = char self.left = None self.right = None # 统计字符频率 def count_freq(text): freq = {} for char in text: if char in freq: freq[char] += 1 else: freq[char] = 1 return freq # 构造哈夫曼树 def build_huffman_tree(freq): forest = [Node(freq[char], char) for char in freq] while len(forest) > 1: forest.sort(key=lambda x: x.freq) node1 = forest.pop(0) node2 = forest.pop(0) new_node = Node(node1.freq + node2.freq) new_node.left = node1 new_node.right = node2 forest.append(new_node) return forest[0] # 构造哈夫曼编码 def build_huffman_code(node, code=''): if node.char: print(node.char, code) else: build_huffman_code(node.left, code + '0') build_huffman_code(node.right, code + '1') # 示例 text = 'hello world' freq = count_freq(text) tree = build_huffman_tree(freq) build_huffman_code(tree) ``` 输出结果为: ``` d 00 h 01 r 100 e 1010 w 1011 o 110 l 1110 1111 ```

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值