数据结构与算法(java版)第一季 - 17 哈夫曼树(了解即可)

本文详细介绍了哈夫曼编码原理,如何通过计算字符频率构建哈夫曼树,以及其在字符串压缩中的应用,展示了如何将'ABBBCCCCCCCCDDDDDDEE'编码压缩41%。重点讲解了哈夫曼树的构建过程和编码规则。
摘要由CSDN通过智能技术生成

目录

哈夫曼编码(Huffman Coding)

哈夫曼树

构建哈夫曼树

 构建哈夫曼编码


哈夫曼编码(Huffman Coding)

哈夫曼编码,又称为霍夫曼编码,它是现代压缩算法的基础
假设要把字符串【ABBBCCCCCCCCDDDDDDEE】转成二进制编码进行传输
可以转成ASCII编码(65~69,1000001~1000101),但是有点冗长,如果希望编码更短呢?
可以先约定5个字母对应的二进制
对应的二进制编码: 000 001001001 010010010010010010010010 011011011011011011 100100
一共20个字母,转成了60个二进制位
如果使用哈夫曼编码,可以压缩至41个二进制位,约为原来长度的68.3%

哈夫曼树

先计算出每个字母的出现频率(权值,这里直接用出现次数),[ABBBCCCCCCCCDDDDDDEE]
利用这些权值,构建一棵哈夫曼树(又称为霍夫曼树、最优二叉树)
如何构建一棵哈夫曼树?(假设有 n 个权值)
1. 以权值作为根节点构建 n 棵二叉树,组成森林
2. 在森林中选出 2 个根节点最小的树合并,作为一棵新树的左右子树,且新树的根节点为其左右子树根节点之和
3. 从森林中删除刚才选取的 2 棵树,并将新树加入森林
4. 重复 2、3 步骤,直到森林只剩一棵树为止,该树即为哈夫曼树

构建哈夫曼树

 构建哈夫曼编码

如上所示:我们已经了解了构建哈夫曼树的过程,接下来就是一个哈夫曼编码过程应用。

√ left为0,right为1进而可以得到5个字母对应的哈夫曼编码

 进而可以得知ABBBCCCCCCCCDDDDDDEE的哈夫曼编码是1110110110110000000001010101010101111

总结
n 个权值构建出来的哈夫曼树拥有 n 个叶子节点(根据路径进行计算出来,叶子节点必然不是另一个叶子节点的前缀)
每个哈夫曼编码都不是另一个哈夫曼编码的前缀,因此可以使用排除法进行得到相应的值.
哈夫曼树是带权路径长度最短的树,权值较大的节点离根节点较近
带权路径长度:树中所有的叶子节点的权值乘上其到根节点的路径长度。与最终的哈夫曼编码总长度成正比关系 (出现次数最多的编码是最短的,出现次数最少的,编码是最长的,这样可以大大减少空间).
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值