FGK adaptive Huffman encode to compress file

最新推荐文章于 2023-06-16 19:04:03 发布

xuan_ting

最新推荐文章于 2023-06-16 19:04:03 发布

阅读量1.2k

点赞数 2

分类专栏：浅谈文章标签：自适应哈夫曼编码

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xuan_ting/article/details/91403435

版权

浅谈专栏收录该内容

23 篇文章 1 订阅

订阅专栏

关于自适应哈夫曼编码，常用的有FGK和Vitter。这里讲的是FGK，先放上一个关于FGK的网页，以便于理解过程。
Visual FGK

FGK算法的原理

夫曼树每一个结点有且仅有两个分支，必须总是保持其兄弟性质，也就是所有的结点都是按照从左到右、从下到上计数递增的顺序排列的。如果违反了兄弟性质，则将触发一个交换过程对节点进行重新排列。当前计数为N的节点要寻找最远的既有计数N的且顺序更前的节点进行交换（包括节点的子树），然后自身次数再更新加一。要对整棵树进行遍历，直到不能更新为止。具体例子请看上方链接。

编码
在这里插入图片描述
解码

①编码器和解码器要用完全相同的Initial_code()和update_tree()。 ②Initial_code为字符分配初始化编码，我采用的就是ASCII码。
③update_tree是构造自适应赫夫曼编码的过程，把读取到的字符次数加一并且更新树。

核心代码

结构体

节点结构体
在这里插入图片描述
字符结构体

encode

create_tree():初始化赫夫曼树

在这里插入图片描述
每次读取一个字符，判断该字符是否出现过，如果已经出现过则输出该字符在树中的编码，在更新节点的次数以及更新树。如果是一个新字符，则先输出树中当前NEW的编码，NEW再分为一个NEW节点和新字符节点，最后更新树。
在这里插入图片描述

getNode():判断字符是否出现过，在symbols数组中查看是否出现过该字符，如果有则返回该字符节点指针。

在这里插入图片描述

codeOfNode():返回该字符节点在树中的编码，左分支为0，右分支为1，以此类推。由于我是从当前节点往根节点方向得到编码，所以最后要倒转编码。

在这里插入图片描述

addCodeToBuffer():把字符编码写入输出文件。

在这里插入图片描述

update_tree():更新赫夫曼树，从当前节点逆着到根节点，更新每个节点的位置和次数和。

在这里插入图片描述

decode

解压文件其实就是压缩文件的逆过程，对读入的每一个bit判断是0还是1，重新构建赫夫曼树，再根据编码把bit转换成ASCII码，得到真正的字符。每一次得到一个字符后都要更新赫夫曼树，注意处理最后一个字节一共有多少位。

源代码

见我的下载

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
FGK adaptive Huffman encode to compress file

##关于自适应哈夫曼编码，常用的有FGK和Vitter。这里讲的是FGK，先放上一个关于FGK的网页，以便于理解过程。添加链接描述稍后更新FGK的讲解和代码。...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。