笔试中经常遇到的哈夫曼树

哈夫曼树学习

前面学习过一些二叉树的知识,但是对于哈夫曼树的学习似乎被我忽略了.但是在最近的学习当中我又遇到了相关的问题,所以我查找资料并复习了一些哈夫曼树的知识.

首先我们来看一下哈夫曼树的构建

给定一组字符和其出现的频率(权值),我们来创建一颗哈夫曼树

字符ABCDE
出现频次13862
  • 构建步骤
  • 1.以权值作为根结点构建n颗二叉树,组成森林
  • 2.在森林中选出2个根结点最小的树合并,作为一颗新树的左右子树,且新树的根结点为其左右子树根结点之和
  • 3.从森林中删除刚才选取的2棵树,并将新树加入森林
  • 4.重复2、3步骤,直到森林只剩一颗树为止,该树即为哈夫曼树.

最初的森林,都是一样高的树

在这里插入图片描述

找到权值最小的两个,构建一颗全新的树

在这里插入图片描述

将构建的带权树放进森林(他就变成了最亮的仔)

在这里插入图片描述

继续寻找两个权值最小的建树

在这里插入图片描述

将建好的树继续放到森林里

在这里插入图片描述

继续寻找权值最小的两棵树构建一个新树

在这里插入图片描述

将建好的树放到森林中,并删除已经加入到新树建设中的树

在这里插入图片描述

继续选择权值最小的两棵树新建树

在这里插入图片描述
可以看到最终我们将整个森林构建成了一颗树(哈夫曼树),而所有的带权字符都在哈夫曼树的叶子结点

构建哈夫曼编码

首先来了解一下前缀编码
如果在一个编码系统中,任一编码都不是其他编码的前缀(最左子串),则称改编码系统中的编码是前缀编码,

举个栗子来说

有一组编码01,001,010,100,110就不是前缀编码,因为01是010的前缀,若去掉01或者010就是前缀编码.

若是前缀编码,则在电文中各字符对应的编码之间不需要分割符,如果不是前缀编码,则必须使用分隔符,否则会生产二义性.

  • 哈夫曼编码是前缀编码
  • 哈夫曼编码是最优前缀编码

那么如何根据所建立的哈夫曼树来编写哈夫曼编码的呢?

首先我们需要知道我们该如何进行编码呢?以什么方式进行编码呢?

对于这个问题,在这里规定了编码方式。既对树中的每个左分支赋予0,右分支赋予1(也可以规定左1右0),则从根到每个叶子结点的通路上,各分支的赋值分别构成一个二进制串,该二进制串就称为哈夫曼编码.

就拿上述将哈夫曼构建中的树来进行编码

在这里插入图片描述
可以通过分支上的数字来进行编码
如下
A:1000
B:101
C:0
D:11
E:1001

  • 总结

  • 1.n个权值构建出来的哈夫曼树拥有n个叶子结点

  • 2.每个哈夫曼编码都不是另一个哈夫曼编码的前置

  • 3.哈夫曼树是带权路径长度最短的树,权值较大的结点离根较近

  • 4.带权路径长度:树中所有的叶子结点的权值乘上其道根结点的路径长度,与最终的哈夫曼编码总长度成正比关系.

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
是一种用于数据压缩和编码的重要数据结构。源文件是指要进行压缩或编码的原始文件,可以是文本文件、图像文件等。在哈,源文件的每个字符都被看作是一个字符节点。 首先,我们需要对源文件进行扫描,统计每个字符在文件出现的频率。然后,根据字符频率构建哈。构建过程,我们将字符节点按照频率从小到大进行排序。每次从频率最小的两个节点选取一个作为左子节点,另一个作为右子节点,新建一个父节点,并将父节点的频率设置为左右子节点频率之和。然后,将新建的父节点插入到节点集合,并保持集合节点按照频率有序。重复上述步骤,直到集合只剩一个节点,即为哈的根节点。 构建完成后,根据哈的特性,可以得到每个字符的编码。在哈,从根节点到每个字符节点的路径上的左右分支分别表示编码的0和1。因此,我们可以通过遍历哈,记录从根节点到每个字符节点的路径,得到每个字符的编码。将源文件的每个字符按照对应的编码进行替换,就可以实现对源文件的压缩或编码。 哈的sourcefile就是指要进行压缩或编码的源文件。通过构建哈和生成字符的编码,我们可以有效地对源文件进行压缩,使其占用更少的存储空间。同时,利用哈进行解码时,根据每个编码对应的字符进行替换,就可以恢复出原始的源文件。哈的应用在数据压缩、网络传输、多媒体文件等方面有广泛的应用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值