一.哈夫曼编码的概念
哈夫曼树又称作最优树,是一种带权路径长度最短的树,而通过哈夫曼树构造出的编码方式称作哈夫曼编码。
1.路径长度
二叉树中一个结点到另一个结点经过的结点方式是唯一的,这些经过的结点称作两个结点之间的路径。
2.结点权值
图当中,每一个结点代表着不同的数字,而这些不同的数字称作结点的权值。
3.带权路径长度
假设同样的例子,由结点A到结点B的过程中,经过的路径长度为3,结点B的权值为4。则3*4=12称作结点的带权路径长度。到结点的带权路径长度计算方式为路径长度乘结点的权值。而树的带权路径长度,意为树的根结点到所有的叶子结点的带权路径长度之和。
二.哈夫曼树构造方法
1.从小到大进行排序,将每一个数据都看成是一个节点,每一个节点可以是最简单的二叉树
2.取出节点权值最小的两颗二叉树
3.组成一个新的二叉树,权值小的为左孩子,两颗二叉树根节点的权值之和
4.再讲将新的二叉树,以根节点的权值大小排序,不断循环,直到所有的数据都被处理
三.哈夫曼编码
左分支为’0’ 右分支为’1’
(若要设计长短不等的编码,则必须时任一字符的编码都不是另一个字符的编码的前缀,这种编码称为前缀编码)
四.代码实现
1.结构体内容
2.找权值最小的两个点
3.构造哈夫曼树
ps:最小的权值结点作为左孩子
4.创建哈夫曼编码
5.主函数
4.实现结果