算法和数据结构(8)哈夫曼树/哈夫曼编码

哈夫曼(huffman)树/哈夫曼编码

ASCII码表中,8位转为一个具体的字符,如字母e和字母p,1万字的文章即一共8万位,即1万字节,但实际文章中字母e出现的频率远大于其他字母,故可以将字母e设计为5位或者4位,一些不常用的字母设计为10位,11位或者12位等,以获得效率的提升和空间的节省;

带权路径长度wpl:设二叉树有n个叶子结点,每个结点的带权值为wk,从根结点到该结点的长度为lk,则每个叶子结点的带权路径长度之和为
在这里插入图片描述

哈夫曼树:wpl最小的二叉树

例:有5个子叶结点,它们的权值为{1,2,3,4,5},用此权值构建不同的二叉树
在这里插入图片描述
wpl计算举例,如上图最左边 15 +42+33+14+2*4 = 34

哈夫曼树的构建

  1. 权值排序
  2. 最小2个合并为左右子树,结点为剩下权值中最小的;

哈夫曼编码

思考:假设本文中有58个字符,并由下面7个字符构成,a,e,i,s,t,space(空格),nl(换行);如果对这7个字符进行编码,使得总编码空间最小(编码若不了解,请百度ascii码相关内容学习)?
频率:在这里插入图片描述
方案:

  1. ascii码编码 58*8 = 464 位;
  2. 用等长编码3位进行编码 58*3 = 174位
  3. 不用等长编码,采用不等长编码,频率大的用小位,频率小的用大位;
不等编码的问题

在这里插入图片描述
采用二叉树编码

  1. 左右分支0,1;
  2. 字符只在叶结点上;
    0
  3. 根据频率在调整该二叉树为哈夫曼树;如图所示;在这里插入图片描述
    此时的花费位数最少;
    回归题目本身:
    频率如下:在这里插入图片描述
    频率排序后如图所示:
    在这里插入图片描述
    进行合并结点:
    在这里插入图片描述
    在这里插入图片描述
    如此设计,从查找的纬度讲为较小,空间利用率最高
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值