基于huffman压缩算法实现文件压缩项目
以字符串“aaaabbbccd”为例实现文件压缩。
(1)统计各字符出现个数
a:4
b:3
c:2
d:1
(2)利用各字符出现的次数作为权值构建huffman树
哈夫曼树又称为最优二叉树,是加权路径长度最短的二叉树。
构建规则:每次在给定数据中挑选出两个权值最小的数,分别作为左右孩子节点,构建一个父节点将两个孩子节点链接起来,父节点权值等于左右孩子权值之和,然后再将父节点放回存放数据的序列;重复过程,直到所有数据存放数中。下图以1,2,3,4四个数字为例构建哈夫曼树。右边为得到的huffman编码。
(3)进行压缩
压缩之前文件中存放的是“aaaabbbccd“一共10个字节;进行编码后每个字符可以使用一段二进制序列表示对应的编码,同样上图的编码