哈夫曼编码、解码,哈夫曼树

  在计算机数据处理中,哈夫曼编码使用变长编码表对源符号(如文件中的一个字母)进行编码,其中变长编码表是通过一种评估来源符号出现机率的方法得到的,出现机率高的字母使用较短的编码,反之出现机率低的则使用较长的编码,这便使编码之后的字符串的平均长度期望值降低,从而达到无损压缩数据的目的。
  例如,在英文中,e 的出现机率最高,而 z 的出现概率则最低。当利用哈夫曼编码对一篇英文进行压缩时,e极有可能用一个bit来表示,而 z 则可能花去 25 个bit(不是 26)。用普通的表示方法时,每个英文字母均占用一个字节,即8个比特。二者相比,e 使用了一般编码的 1/8 的长度,z 则使用了 3 倍多。倘若我们能实现对于英文中各个字母出现概率的较准确的估算,就可以大幅度提高无损压缩的比例。

  哈夫曼树又称最优二叉树,是一种带权路径长度最短的二叉树。哈夫曼树就是哈夫曼编码(在数据通信中,需要将传送的文字转换成二进制的字符串,用 0,1 码的不同排列来表示字符)的过程(一般都是哈夫曼静态编码):
  它对需要编码的数据进行两遍扫

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值