哈夫曼树与编码

最新推荐文章于 2024-06-01 16:08:08 发布

abcd1101

最新推荐文章于 2024-06-01 16:08:08 发布

阅读量1.2w

点赞数 4

分类专栏：数据结构[逻辑结构]-树文章标签：数据结构树哈夫曼

数据结构[逻辑结构]-树专栏收录该内容

5 篇文章 0 订阅

订阅专栏

1.造树

1）构成初始集合

对给定的n个权值{W1,W2,W3,...,Wi,...,Wn}构成n棵二叉树的初始集合F={T1,T2,T3,...,Ti,...,Tn}，其中每棵二叉树Ti中只有一个权值为Wi的根结点，它的左右子树均为空。（为方便在计算机上实现算法，一般还要求以Ti的权值Wi的升序排列。）

2）选取左右子树

在F中选取两棵根结点权值最小的树作为新构造的二叉树的左右子树，新二叉树的根结点的权值为其左右子树的根结点的权值之和。

3）删除左右子树

从F中删除这两棵树，并把这棵新的二叉树同样以升序排列加入到集合F中。

4）重复二和三两步

重复二和三两步，直到集合F中只有一棵二叉树为止。

2.例子
如果加入输入AAAABBBCCD，根据上面步骤会得到这样一棵树
A:4, B:3, C:2, D:1
先取最小的c、d造树，然后权值相加赋值给根节点，然后再与b的权值相加
这里写图片描述

所以各字符的编码是：
A:0, B:10, C:110, D:111
那编码就是0000101011011011
长度就是4*1+2*2+3*2+3=17

3.例子2
假设用于通信的电文由字符集{a,b,c,d,e,f,g,h}中的字母构成，这8个字母在电文中出现的概率分别为{0.07,0.19,0.02,0.06
,0.32,0.03,0.21,0.10}. (1)为这8个字母设计哈夫曼编码。
(2)若用这三位二进制数(0…7)对这8个字母进行等长编码，则哈夫曼编码的平均码长是等长编码的百分之几?它使电文总长平均
压缩多少? 解： (1)哈夫曼编码根据上图可得编码表： a:1001 b:01 c:10111 d:1010 e:11 f:10110 g:00
h:1000 (2)用三位二进行数进行的等长编码平均长度为3，而根据哈夫曼树编码的平均码长为：
4*0.07+2*0.19+5*0.02+4*0.06+2*0.32+5*0.03+2*0.21+4*0.10=2.61 2.61/3=0.87=87% 其平均码长是等长码的87%。
所以平均压缩率为13%。

4.优缺点与应用
静态的哈夫曼编码，它对需要编码的数据进行两遍扫描：第一遍统计原数据中各字符出现的频率，利用得到的频率值创建哈夫曼树，并必须把树的信息保存起来，即把字符0-255(2^8=256)的频率值以2-4BYTES的长度顺序存储起来，（用4Bytes的长度存储频率值，频率值的表示范围为0--2^32-1，这已足够表示大文件中字符出现的频率了）以便解压时创建同样的哈夫曼树进行解压；第二遍则根据第一遍扫描得到的哈夫曼树进行编码，并把编码后得到的码字存储起来。静态哈夫曼编码方法有一些缺点：一、对于过短的文件进行编码的意义不大，因为光以4BYTES的长度存储哈夫曼树的信息就需1024Bytes的存储空间；二、进行哈夫曼编码，存储编码信息时，若用与通讯网络，就会引起较大的延时；三、对较大的文件进行编码时，频繁的磁盘读写访问会降低数据编码的速度。

动态编码

因此，后来有人提出了一种动态的哈夫曼编码方法。动态哈夫曼编码使用一棵动态变化的哈夫曼树，对第t+1个字符的编码是根据原始数据中前t个字符得到的哈夫曼树来进行的，编码和解码使用相同的初始哈夫曼树，每处理完一个字符，编码和解码使用相同的方法修改哈夫曼树，所以没有必要为解码而保存哈夫曼树的信息。编码和解码一个字符所需的时间与该字符的编码长度成正比，所以动态哈夫曼编码可实时进行。动态哈夫曼编码比静态哈夫曼编码复杂的多，有兴趣的读者可参考有关数据结构与算法的书籍。

前面提到的JPEG中用到了哈夫曼编码，并不是说JPEG就只用哈夫曼编码就可以了，而是一幅图片经过多个步骤后得到它的一列数值，对这些数值进行哈夫曼编码，以便存储或传输。哈夫曼编码方法比较易懂，大家可以根据它的编码方法，自己编写哈夫曼编码和解码的程序。

abcd1101

关注

4
点赞
踩
15

收藏

觉得还不错? 一键收藏
2
评论
哈夫曼树与编码

1.造树1）构成初始集合对给定的n个权值{W1,W2,W3,...,Wi,...,Wn}构成n棵二叉树的初始集合F={T1,T2,T3,...,Ti,...,Tn}，其中每棵二叉树Ti中只有一个权值为Wi的根结点，它的左右子树均为空。（为方便在计算机上实现算法，一般还要求以Ti的权值Wi的升序排列。）2）选取左右子树在F中选取两棵根结点权值最小的树作为新构造的二叉树的左
复制链接

扫一扫

专栏目录