贪心算法之哈夫曼编码(思路详解+画图演示算法过程)

哈夫曼编码

一些需要了解的基本概念

对字符的编码有两种:定长编码和变长编码,两者的编码长度往往差得很大,以下面的编码为例。

定长编码:
在这里插入图片描述
编码长度为:10000*3=30000

变长编码:
在这里插入图片描述
编码长度为:45001+13003+1200-3+16003+9004+500*4=22400

定义:前缀码

前缀码是对字符的0,1编码,任意字符的编码都不是其它字符编码的前缀。

例如:
在这里插入图片描述
如果我们接收到了:001011101

那么我可以将其翻译为:aabe

定义:前缀码跟二叉树的转换

在这里插入图片描述
在这里插入图片描述
定义:平均码长(二叉树代价)

已知一颗根据字符集合C构造的二叉树T,对于C中出现的任意字符x,定义其出现频率(权重)为f(x),其在T中的深度为dt(x),则二叉树T的平均码长为:
在这里插入图片描述
举例:
在这里插入图片描述
其平均码长为:

B(T)=0.451+0.123+0.133+0.163+0.054+0.094
=2.24

哈夫曼编码问题定义

输入:

字符集C,对于C中的任意字符x,其出现频率(权重)为 f (x)

输出:

平均码长最短的前缀码编码方案(哈夫曼编码,也就是代价最小的前缀二叉树)

贪心算法解题思路

选择权重最小的两颗子树构成二叉树

新的二叉树的权重等于两颗子树权重的和

例如:

初始化:在这里插入图片描述
选择权重最小的子树,也就是f和e,构成新的子树如下:(我们默认把小的放左侧,大的权重放右侧)
在这里插入图片描述
根据新的权重:
在这里插入图片描述

选择最小的再构成新的子树:
在这里插入图片描述
直到所有的元素形成一颗二叉树为止:

在这里插入图片描述
然后对每棵树的分支进行编码,左支为0,右支为1,要得到某个字符的前缀码只需要从根结点遍历到这个结点即可。

  • 1
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
哈夫曼编码是一种贪心算法,用于将字符集中的字符进行编码,使得编码后的平均码长最短。它是一种前缀码,即任何一个字符的编码都不是其他字符编码的前缀。 下面是哈夫曼编码的步骤: 1. 统计字符集中每个字符出现的频率,并将每个字符作为一个独立的树叶。 2. 将这些树叶按照频率从小到大排序。 3. 从频率最小的两个树叶中选择一个根节点,频率较小的作为左子树,频率较大的作为右子树,构建一棵新的树。 4. 将新构建的树插入到原来的树叶列表中,并保持列表有序。 5. 重复步骤3和步骤4,直到只剩下一个树。 6. 最后剩下的树即为哈夫曼树,树中的每个叶子节点对应一个字符,从根节点到叶子节点的路径上的0和1分别表示编码中的0和1。 7. 根据哈夫曼树生成每个字符的编码。 以下是一个示例: 假设字符集为{'A': 5, 'B': 9, 'C': 12, 'D': 13, 'E': 16, 'F': 45},其中每个字符的频率已经给出。 1. 构建初始的树叶列表:[('A', 5), ('B', 9), ('C', 12), ('D', 13), ('E', 16), ('F', 45)] 2. 选择频率最小的两个树叶'A'和'B',构建新的树:[('AB', 14), ('C', 12), ('D', 13), ('E', 16), ('F', 45)] 3. 选择频率最小的两个树叶'C'和'D',构建新的树:[('AB', 14), ('CD', 25), ('E', 16), ('F', 45)] 4. 选择频率最小的两个树叶'E'和'AB',构建新的树:[('ABE', 30), ('CD', 25), ('F', 45)] 5. 选择频率最小的两个树叶'CD'和'ABE',构建新的树:[('ABECD', 55), ('F', 45)] 6. 最后剩下的树为:[('ABECD', 55), ('F', 45)] 根据哈夫曼树生成的编码如下: A: 00 B: 01 C: 10 D: 11 E: 110 F: 111

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值