浙大数据结构-5.2 Huffman Tree & Huffman Code

本文介绍了哈夫曼编码的概念,它是通过构建最优二叉树(哈夫曼树)来实现数据压缩的一种方法。哈夫曼树的特点包括没有度为1的结点,编码无前缀冲突,并且具有最小带权路径长度。通过将权值最小的两棵树合并来构造哈夫曼树。此外,文章还探讨了哈夫曼编码在文本压缩中的应用,以及如何根据字符频率设计编码。对于给定的字符频率,可以通过哈夫曼编码减少文本所占位数。
摘要由CSDN通过智能技术生成

Huffman Tree的定义

带权路径长度(WPL):设二叉树有n个叶子结点,每个叶子节点带有权值wk,从根节点到每个叶子结点的长度为lk,则每个叶子节点的带权路径长度之和

最优二叉树或哈夫曼树:WPL最小的树

实际意义:根据结点不同的查找频率构建更有效的搜索树

Huffman Tree的构造

每次把权值最小的两棵二叉树合并

typedef struct TreeNode *HuffmanTree;
struct TreeNode{
	int Weight;
	HuffmanTree Left, Right;
};
HuffmanTree Huffman( MinHeap H ){
	/*假设H->Size个权值已经存在H->Elements[]->Weight里*/
	int i;
	HuffmanTree T;
	BuildMinHeap( H );/**/
	for ( i = 1; i < H -> Size; ++i){
		T = malloc( sizeof (struct TreeNode ) );
		T->Left = DeleteMin( H );
		T->Right = DeleteMIn( H );
		T->Weight = T->Left->Weight + T->Right->Weight;
		Insert( H, T );
	}
	T->DeleteMin(H);
	return T;
}

Huffman Tree的特点

没有度为1的结点

任一字符的编码串都不是另一字符编码串的前缀(因为根通往任一叶子结点的路径不可能是通往其余叶子结点的子路径)

n个叶子结点的Huffman Tree共有2n-1个结点

Huffman Tree的任意非叶结点的左右子树交换后仍是Huffman Tree

对同一组权值,存在两棵不同构的Huffman Tree,但是WPL值相同

Huffman Code

在进行不等长编码时,利用前缀码避免二义性,同时能节省存储空间

前缀码prefix code:任何字符的编码都不是另一字符编码的前缀(可以无二义地解码)

二叉树用于编码时:左右分支分别为01,字符仅在叶结点上

构造一棵编码代价最小的二叉树

为五个使用频率不同的字符设计哈夫曼编码,下列方案中哪个不可能是哈夫曼编码?

  • A.
    00100101110111
  • B.
    000001011011
  • C.
    00000001001011
  • D.
    0000010100111

正确答案:A你选对了

 

技巧:任一字符的编码串都不是另一字符编码串的前缀(因为根通往任一叶子结点的路径不可能是通往其余叶子结点的子路径)

Haffman树的结点的度为0/2,不可能为1

 

 

一段文本中包含对象{a,b,c,d,e},其出现次数相应为{3,2,4,2,1},则经过哈夫曼编码后,该文本所占总位数为:

  • A.
    12
  • B.
    27
  • C.
    36
  • D.
    其它都不是

正确答案:B你错选为D

Huffman n 叉树

赫夫曼n叉树是赫夫曼二叉树的一种特例,对于节点数目大于大于等于2的待处理序列,都可以构造赫夫曼二叉树,但是不一定能构造n叉树。当发现无法构造时,需要补上权值为0的结点(因为构造的目的是最小的WPL,0权值点无影响)

 

 

 

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值