哈夫曼树是带权路径和中权值最小的树。哈夫曼树又称为最优二叉树。
哈夫曼树有以下几个特点:
(1)带权路径和最小
(2)不存在度为1的节点
(3)哈夫曼总结点数为 2n-1(n为带权节点个数)
(4)权值越小的节点到根节点的路径越长
(5)由于构建过程中,并未严格区分左右子树,故最优二叉树个数不唯一。
常见考点:【哈夫曼树构建+哈夫曼树特点+哈夫曼编码】
(1)给定{3,5,6,9,12},求解对应的哈夫曼树和权值之和或者直接问带权路径和最小值。
哈夫曼树构建过程:
(a)将给定节点排序,按照从小到大
(b)找出节点中最小的两个值,作为一棵二叉树的左右子树,其根节点的值为 两个节点的和。
(c)将节点和放入节点中,再次排序,挑出较小的两个值组成子树,直至生成一颗哈夫曼树。
为什么要将节点放入?避免一直构造,而忽视一些不能和根节点一起构建的节点。
上面题目,构建过程:
(2)给定节点总数215,一共可以得到多少不同的码字?
分析:不同码字对应不同的叶子节点,实际问的是,节点总数为215,有多少个叶子节点。
n = n0+n2 (哈夫曼特点)
n0-1 = n2 联立求解,n0=108
(3)哈夫曼树可以解决报文编码问题。假设需要一个字符串“aaaabbbbccccdddeeeeffffaaaabbbbcceffffabbbbfffffff”进行编码,将它转换为唯一的二进制码,但要求转换出来的二进制编码的长度最小。请问,字母分别对应的编码是多少?题目来自此处。
首先统计每个字符出现的次数,(次数就是节点)然后按照次数从小到大构建哈夫曼树。
(4)假设用于通信的电子由字符集{a,b,c,d,e,f,g,h}字母构成,这8个字母在电文中出现的概率分别为{0.07,0.19,0.02,0.06,0.32,0.03,0.10}画出哈夫曼树,并为这8个字母设计哈弗曼编码,求解平均编码长度。题目来自此处。
平均编码长度:节点权值*编码长度
求解过程: