哈夫曼编码

最新推荐文章于 2024-06-03 17:26:16 发布

严霜九月丶

最新推荐文章于 2024-06-03 17:26:16 发布

阅读量731

点赞数

分类专栏：算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40327837/article/details/85242398

版权

本文介绍了如何利用哈夫曼编码实现数据的最优压缩。哈夫曼编码是一种基于字符频率的不定长编码方式，能确保编码的最短长度且无二义性。通过构造哈夫曼树，将频率高的字符靠近根节点，编码过程中，左孩子代表0，右孩子代表1。文章提供了一段C++代码来构建哈夫曼树并生成编码。

摘要由CSDN通过智能技术生成

问题描述：

如果我们有一个10万个字符的数据文件。每个字符出现的频率不同，现在我们要用最少的空间存储数据，也就是将这10万个数据进行编码，得到最优编码序列。

问题分析：

一般的编码有定长编码和不定长编码，如果采用定长编码，如果字符文件一共有6个字符，那么定长编码一个字符的长度为3（二进制编码），10万个字符编码需要30万个字节空间，如果字符文件的字符种类更多，随着字符种类的增加，需要的字节空间爆涨，显然不符合我们的最优编码序列，分析问题，我们需要解决两个问题。1.编码尽可能短。2.不能有二义性。什么是二义性？比如a：0，b:1,c:11,现在给你一个序列0111，这个序列是表示abc,还是abbb?，这里我们考虑前缀码，既没有任何码字是其他码字的前缀，与任何字符编码相比，前缀码可以保证最优的数据压缩率。

数据结构：

哈夫曼编码的基本思想是按照字符的频率构造一颗哈夫曼树，频率越高的字符，离根节点越近，并且规定位于节点左边的左孩子跟他父节点的边的权值为0，右边的为1，构造哈夫曼的过程是选取两个节点没有双亲并且权值最小的作为左右子树。

代码:

#include <iostream>
#include <algorithm>
#include <cstring>
using namespace std;
#define MAXBIT 100
#define MAXVALUE 10000
#define MAXLEAF 30
#define MAXNODE 2

最低0.47元/天解锁文章

严霜九月丶

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。