【数据结构】哈夫曼树和哈夫曼编码

最新推荐文章于 2024-08-20 09:12:37 发布

阿瑾0618

最新推荐文章于 2024-08-20 09:12:37 发布

阅读量1.7k

点赞数 48

分类专栏：数据结构算法 # 数据结构文章标签：数据结构算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/eristic0618/article/details/139182440

版权

数据结构同时被 3 个专栏收录

23 篇文章 3 订阅

订阅专栏

14 篇文章 0 订阅

订阅专栏

4 篇文章 0 订阅

订阅专栏

一、哈夫曼树

1.1 哈夫曼树的概念

给定一个序列，将序列中的所有元素作为叶子节点构建一棵二叉树，并使这棵树的带权路径长度最小，那么我们就得到了一棵哈夫曼树（又称最优二叉树）

接下来是名词解释：

权：节点的数值
路径长度：两节点间路径的边数
带权路径长度：节点的权值乘以该节点到根节点的路径长度即为该节点的带权路径长度。哈夫曼树的带权路径长度是树中所有叶子节点的带权路径长度之和。

例如下面这棵哈夫曼树：

通过观察我们可以发现，所有父节点的权值都是自身的两个子节点的权值之和。而为了要使树的带权路径长度最小，我们要尽可能的让权值小的节点离根节点远，让权值大的节点离根节点近。

因此，我们引出哈夫曼树的构造算法。

1.2 哈夫曼树的构造算法

要将一个序列构造成一棵哈夫曼树，我们首先需要对其进行升序排序

将排序好后的序列中的每个值看作一棵只有一个节点的树，从中选出根节点权值最小的两棵树作为新树的左右子树，并将这两棵树从序列中删除，而新树的根节点的权值是这两棵树根节点的权值之和

哈夫曼树没有规定左右子树的顺序，因此下面的例子中将10和18的位置对调也是正确的

将新树的根节点的权值放入序列中并重新进行升序排序，重复上述步骤

至此，就构建了一棵哈夫曼树

因为哈夫曼树没有规定左右子树的顺序，因此一个序列可以构建出不同的哈夫曼树

二、哈夫曼编码

2.1 等长编码

假设我们要对一个字符串ABAACDC进行二进制编码

我们可以按顺序给每个字符设置一个编码，A为0，B为1，C为10，D为11

那么就可以将上面的字符串转化为0100101110

但是在解码的时候我们会发现，这一串二进制序列可以解码为ACACDBA、ACABABDA等字符串，出现了歧义。

这是因为我们在对字符进行编码的时候，出现了一个字符是另一个字符的前缀的情况，例如D可以用两个B来表示。

为了避免歧义，我们可以采用等长编码的方案，就是每个字符的编码都一样长，例如A为00，B为01，C为10，D为11，这样就不会产生歧义了。

但是这种方案并不是一个最短的方案。

2.2 哈夫曼编码

统计字符出现的次数，把字符定义成一个节点，节点的权值就是它出现的次数。

例如上面A出现了3次，B出现了1次，C出现了2次，D出现了1次

哈夫曼编码的核心思想就是让出现次数越多的字符编出来的码越短，我们将全部节点构建成一棵哈夫曼树，出现次数越少的字符对应的节点就越靠近树的底层，编码也就越长，出现次数越多的字符编码就越短。

对二叉树的边标号，向左的边标为0，向右的边标为1，至此所有字符的编码就是从根节点到该字符节点路径上经过的标号，例如A为1，B为010，C为00，D为011，这种编码方案就叫做哈夫曼编码。

构建哈夫曼树的时候，所有的字符节点都是叶子节点，不会出现一个字符出现在另一个字符的路径上，也就不会出现一个字符是另一个字符的前缀这种造成歧义的情况

哈夫曼树的编码不是唯一的，节点放置的左右也会造成字符编码的不同，但是生成的编码长度一定都是一样的。

完.

关注

48
点赞
踩
32

收藏

觉得还不错? 一键收藏
30
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

阿瑾0618

CSDN认证博客专家 CSDN认证企业博客

码龄1年

94: 原创

241: 周排名

4615: 总排名

13万+: 访问

: 等级

6943: 积分

1668: 粉丝

3386: 获赞

1387: 评论

2973: 收藏

私信

关注

热门文章

分类专栏

C++ 22篇
Python 2篇
Java 1篇
数据结构 23篇
Linux 16篇
MySQL 5篇
算法 14篇
基础算法 1篇
数据结构 4篇
图论 7篇
C 14篇
前端 2篇
OJ专栏 5篇
问题合集 1篇

最新评论

【算法】Floyd多源最短路径算法
outlier.cc: 优质好文，博主的文章细节很到位，兼顾实用性和可操作性
【算法】Prim最小生成树算法
9毫米的幻想: '这篇文章实在是太棒了！内容丰富，论述清晰，代码实例更是琳琅满目，让人阅读起来津津有味。博主的专业素养和用心程度从中可见一斑，无疑为读者提供了一笔宝贵的知识财富。文章从基础概念出发，由浅入深地阐述了编程的核心思想。在阅读过程中，我感受到了博主对编程的热爱和敬业精神，他/她用通俗易懂的语言，将复杂的编程知识讲解得淋漓尽致。这使得读者在阅读过程中既能够掌握知识，又能够保持兴趣。'
【算法】Floyd多源最短路径算法
失落的叶子。: 这篇文章非常棒！内容丰富、论述清晰，代码实例众多，读起来很有趣味。博主专业素养高且用心，为读者提供了宝贵知识财富。文章从基础概念入手，深入浅出阐述编程核心思想，阅读中能感受到博主对编程的热爱与敬业，其用通俗易懂的语言把复杂知识讲得很透彻，让读者既能掌握知识又能保持兴趣。
【算法】Floyd多源最短路径算法
Bucai_不才: 耳目一新
【算法】Floyd多源最短路径算法
白子寰: 大江南北文采扬，剑胆琴心著华章。师法自然才情显，兰桂齐芳韵悠长。特立独行观点新，支笔舞墨书千古。持之以恒文思宽，你才惊艳众人赞。

最新文章

2024

目录

评论 30

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。