c++哈夫曼树+哈夫曼编码详解

最新推荐文章于 2023-10-11 16:33:15 发布

浪子小院

最新推荐文章于 2023-10-11 16:33:15 发布

阅读量499

点赞数 1

分类专栏：基础精讲文章标签： c++ 算法数据结构开发语言 java

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/YoyoHuzeyou/article/details/131025247

版权

基础精讲专栏收录该内容

70 篇文章 9 订阅

订阅专栏

Part1: 哈夫曼树

给定N个权值作为N个叶子结点，构造一棵二叉树，若该树的带权路径长度达到最小，称这样的二叉树为最优二叉树，也称为哈夫曼树(Huffman Tree)。

与哈夫曼树有关的概念：

路径：树中一个结点到另一个结点之间的分支构成这两个结点之间的路径。

路径长度：路径上的分枝数目称作路径长度。

树的路径长度：从树根到每一个结点的路径长度之和。

结点的带权路径长度：在一棵树中，如果其结点上附带有一个权值，通常把该结点的路径长度与该结点上的权值之积称为该结点的带权路径长度。

树的带权路径长度：如果树中每个叶子上都带有一个权值，则把树中所有叶子的带权路径长度之和称为树的带权路径长度。

设某二叉树有n个带权值的叶子结点，则该二叉树的带权路径长度记为：

公式中，Wi为第i个叶子结点的权值；Li为该结点的路径长度。

例如：

哈夫曼树是带权路径长度最小的树，权值较大的结点离根较近。

根据哈弗曼树的定义，一棵二叉树要使其WPL值最小，必须使权值越大的叶子结点越靠近根结点，而权值越小的叶子结点越远离根结点。

Huffman算法框架如下：

假设有n个权值，则构造出的哈夫曼树有n个叶子结点。 n个权值分别设为 w1、w2、…、wn，则哈夫曼树的构造规则为：

(1) 将w1、w2、…，wn看成是有n 棵树的森林(每棵树仅有一个结点)；

(2) 在森林中选出两个根结点的权值最小的树合并，作为一棵新树的左、右子树，且新树的根结点权值为其左、右子树根结点权值之和；

(3) 从森林中删除选取的两棵树，并将新树加入森林；

(4) 重复(2)、(3)步，直到森林中只剩一棵树为止，该树即为所求得的哈夫曼树。

例如：

Part 2: 哈夫曼编码

哈夫曼编码(Huffman Coding)，又称霍夫曼编码，是一种编码方式，哈夫曼编码是可变字长编码(VLC)的一种。Huffman于1952年提出一种编码方法，该方法完全依据字符出现概率来构造异字头的平均长度最短的码字，有时称之为最佳编码，一般就叫做Huffman编码（有时也称为霍夫曼编码）。

显然字使用频率越小权值越小，权值越小叶子就越靠下，于是频率小编码长，频率高编码短，这样就保证了此树的最小带权路径长度效果上就是传送报文的最短长度。因此，求传送报文的最短长度问题转化为求由字符集中的所有字符作为叶子结点，由字符出现频率作为其权值所产生的哈夫曼树的问题。利用哈夫曼树来设计二进制的前缀编码，既满足前缀编码的条件，又保证报文编码总长最短。

在数据通信中，需要将传送的文字转换成二进制的字符串，用0，1码的不同排列来表示字符。传送报文时总是希望总长度尽可能短。在实际应用中，各个字符的出现频度或使用次数是不相同的，有A,B,C,D,E五个字符，出现的频率（即权值）分别为5,4,3,2,1，自然会想到设计编码时，让使用频率高的用短码，使用频率低的用长码，以优化整个报文编码。

哈夫曼树

各字符对应的哈夫曼编码为：A->11,B->10,C->00,D->011,E->010

例：判定树比较次数最少

在很多问题的处理过程中，需要进行大量的条件判断，这些判断结构的设计直接影响着程序的执行效率。例如，编制一个程序，将百分制转换成五个等级输出。大家可能认为这个程序很简单，并且很快就可以用下列形式编写出来：

若考虑上述程序所耗费的时间（比较次数），就会发现该程序不一定最优。在实际中，学生成绩在五个等级上的分布是不均匀的。当学生百分制成绩的录入量很大时，上述判定过程需要反复调用，此时程序的执行效率不高。

下面就是在一次考试中某门课程的各分数段的分布情况：

我们就可以利用哈夫曼树寻找一棵最佳判定树，即总的比较次数最少的判定树。

程序详见下一章->拜拜 ~ \^v^/~

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

浪子小院 CSDN认证博客专家 CSDN认证企业博客

码龄2年

258: 原创

5565: 周排名

32万+: 总排名

21万+: 访问

: 等级

3393: 积分

1万+: 粉丝

532: 获赞

127: 评论

800: 收藏

私信

关注

热门文章

分类专栏

最新评论

01:求平均年龄
2401_88631281: 这个是用的c++嘛用c语言可以写出来吗我还没学到c++
c++后缀表达式实现eval详解（附代码）
happy4nothing: 代码还存在问题。例子：7*(4-4/7) 转换后缀表达式：7447/- * 减号和乘号之间多了一个空格，导致最终结果为0，存在ExpressionError。不会修改，请作者再修改一下，哈哈
C++约瑟夫问题的10种解法【学不会私信我】
酩酊の念: 有没有什么办法既不会时间超限又不会内存超限,要求n<2^32
C++约瑟夫问题的10种解法【学不会私信我】
酩酊の念: 解法三和解法七不是一样的嘛
深入理解原码、反码和补码及其在计算机中的应用【附代码】
做而论道_CS: 四、代码实例下面是使用C++实现原码、反码和补码转换的示例代码：－－－－－－－－－－－－－－－－－－－－－－－－－原码和补码，互相转换？它们，也不是一一对应的，能互相转换吗？补码，比原码多一个，这是常识，你不知道？字长为 16 位数时，　补码，可表示：－32768 ~ +32767。　原码，却只有：－32767 ~ +32767。－32768，根本就没有原码，你怎么转换？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

浪子小院 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。