实验原理:
霍夫曼编码是一种无失真的信源编码,其基本思想是对于概率大的符号用短码表示,对概率小的符号用长码表示,从而使得编码后的信源的平均码长接近香农定理中给出的变长编码平均码长的下界H(X)/logr。为了使得编码得到的码字为即时码,在程序中使用二叉树来对信源进行编码。
霍夫曼编码的步骤如下:
第一步:将文件读入缓存区;
第二步:之字形扫描,统计信源的各符号的概率;
第三步:按照概率排列信源符号,将两个最小的概率作为二叉树的树叶节点,两个概率的和作为根节点,在将新的节点(树叶节点不参与比较)重新排序,选出概率最小的作为树叶节点,重复该步骤直到最终的根节点概率为1,码树生成结束;
第四步:将码表及其他信息写到输出文件,写码表时采用深度优先的遍历方法,将形成的二叉树所有左节点标0,右节点标1,再从根节点向下读,得到每个信源符号的码字,形成完整的码表;
<