17.0、C语言数据结构——浅析赫夫曼树

最新推荐文章于 2024-03-12 14:41:48 发布

澜色海湾

最新推荐文章于 2024-03-12 14:41:48 发布

阅读量736

点赞数

分类专栏： C语言数据结构学习总结文章标签： C语言数据结构赫夫曼树浅析

本文链接：https://blog.csdn.net/m0_52433668/article/details/127347013

版权

C语言数据结构学习总结专栏收录该内容

24 篇文章 1 订阅

订阅专栏

17.0、C语言数据结构——浅析赫夫曼树

在数据膨胀、信息爆炸的今天，数据压缩的意义不言而喻；谈到数据亚索，就不能不提赫夫曼（Huffman）编码，赫夫曼编码是首页实用的压缩编码方案，即使在今天的许多知名压缩算法里，依然可以见到赫夫曼编码的影子；

另外，在数据通信中，用二进制给每个字符进行编码时不得不面对一个问题是如何使电文总长最短且不产生二义性；根据字符出现频率，利用赫夫曼编码可以构造出一种不等长的二进制，是编码后的电文长度最短，且保证不产生二义性；

在介绍赫夫曼编码前，给大家看个例子 ->

if(a < 60) {
    printf("不及格");
}else if(a < 70) {
    printf("及格");
}else if(a < 90) {
    printf("良好");
}else {
    printf("优秀");
}

由于优秀的占比较多占到了 70%，但是优秀的判断在第三个， 70% 都要判断三次效率太低，那么如果把这个判断放到前面第一个或者第二个效率就会提高；

我们先把这两棵二叉树换件成叶子结点带权的二叉树（注：树结点间的连线相关的数叫做权，weight）；

结点的路径长度：

- 从根结点到该结点的路径上的连接数；

树的路径长度：

- 树中每个叶子结点的路径长度之和；

结点带权路径长度：

- 结点的路径长度与结点权值的乘积

树的带权路径长度：

- WPL（Weighted Path Length）是树种所有叶子结点的带权路径长度之和；

WPL的值越小，说明构造出来的二叉树性能越优；