哈夫曼树的定义
路径长度:从树的一个结点到另一个结点之间的分支构成两个结点之间的路径,路径上的分支数目称作路径长度
树的路径长度:从树根到每一个结点的路径长度之和。
哈夫曼树:如果考虑带权的结点,结点的带权路径长度为从该结点到树根之间的路径长度与结点上权的乘积。树的带权路径长度为树中所有叶子结点的带权路径长度之和,带权路径长度WPL最小的二叉树称为哈夫曼树。
哈夫曼树的算法描述
- 根据给定的n个权值 w 1 , w 2 , w 3 , . . . , w n {w_1,w_2,w_3,...,w_n} w1,w2,w3,...,wn构成的n棵二叉树的集合 F = T 1 , T 2 . . . T 3 F={T_1,T_2...T_3} F=T1,T2...T3,其中每棵二叉树 T i T_i Ti只有一个带权为 w i w_i wi的根结点,左右子树为空。
- 在F中选取两棵根结点的权值最小的树作为左右子树构造一棵新的二叉树,且置新的二叉树的根结点的权值为其左右子树上根结点的权值之和。
- 在F中删除这两棵树,同时将新得到的二叉树加入F中。
- 重复2和3步骤,直到F中只含一颗树为止,这棵树便是哈夫曼树。
哈夫曼树的应用—哈夫曼编码
设需要编码的字符集为 d 1 , d 2 . d 3 , . . . d n {d_1,d_2.d_3,...d_n} d1,d2.d3,...dn,各个字符在电文中出现的次数或频率为 w 1 , w 2 , . . . , w n {w_1,w_2,...,w_n} w1,w2,...,w