哈夫曼树构造及编码

最新推荐文章于 2024-09-05 17:02:04 发布

theArcticOcean

最新推荐文章于 2024-09-05 17:02:04 发布

阅读量5.1k

点赞数 2

分类专栏： algorithm_数据结构文章标签：算法

本文链接：https://blog.csdn.net/thearcticocean/article/details/46597773

版权

本文介绍了哈夫曼树的构造过程，强调了在构建过程中度为2的新节点数量与总结点数的关系，以及哈夫曼树没有度为1的结点特性。同时，详细阐述了哈夫曼编码的生成方法，包括从叶子结点到根结点的编码过程以及从根结点到叶子结点的译码过程。通过两个实例展示了不同输入数据生成的哈夫曼编码，进一步理解其最优二叉树的特性。

摘要由CSDN通过智能技术生成

哈夫曼树：
树的带权路径长度是树中所有叶子结点的带权路径长度之和。一组具有确定权值的叶结点可以构成多个带权二叉树。带权路径长度最小的二叉树就称作最优二叉树，或者哈夫曼树。通过实践可以发现，哈夫曼树总是把权值大的叶结点放在靠近根结点的地方，权值小的结点放在深度大的地方。哈夫曼算法给出了构造哈夫曼树的基本思想：
1.给出n个权值各异的结点作为n颗二叉树的根结点，左右子树均空，组成二叉树集合F；
2.在F中找出两颗权值最小的树作为左右子树构成一颗新树，新树的根结点的权值是左右子树根结点的权值之和；
3.在F中删除刚刚选出的左右子树，把新树放进F；
4.重复2.3剩下的那颗树就是要求的哈夫曼树。
哈夫曼编码：
在数据通信中需要把电文字符转化成0,1（编码），在接收端需要将二进制码转化成对应的字符串（译码）。在发送电文时需要在保证正确的情况下让代码尽可能的短，这就要求原字符串中出现次数较多的字符的转化码要短，同时一段二进制码不能有二义性，即不能有多种翻译方式，这又要求任意字符的编码不能是另一个字符编码的前缀。我们把字符出现的次数看做权值，把所有的字符都放在叶子结点上，这样就解决了上述的两个问题。于是焦点就集中在了哈夫曼树上。这样的编码称为哈夫曼编码。

初始森林中有n颗只有根结点的树，要合成哈夫曼树必要进行n-1次合并，n-1次合并也就产生了n-1个新的结点，这些新结点的度是2，所以哈夫曼树的总结点数是2n-1，哈夫曼树没有度为1的分支结点（严格的或正则的二叉树）。编码：从叶子结点出发走到根；译码：从根结点走到叶子结点。

例子：

输