霍夫曼树与霍夫曼编码
1、霍夫曼树的基本介绍
- 给定 n个权值作为 n个叶子结点,构造一棵二叉树,若该树的带权路径长度(wpl)达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树(Huffman Tree)
- 哈夫曼树是带权路径长度最短的树,权值较大的结点离根较近
2、霍夫曼树中的重要概念
路径:在一棵树中,从一个结点往下可以达到的孩子或孙子结点之间的通路,称为路径。
路径长度:若规定根结点的层数为1,则从根结点到第L层结点的路径长度为 L-1 (例:第三层到根节点的长度为2)
结点的权:若将树中结点赋给一个有着某种含义的数值,则这个数值称为该结点的权(一般是这个结点的值)
结点的带权路径长度:从根结点到该结点之间的路径长度与该结点的权的乘积(W×L)
树的带权路径长度:树的带权路径长度规定为所有叶子结点的带权路径长度之和(W1×L1+W2×L2…),记为WPL(weighted pathlength) ,权值越大的结点离根结点越近的二叉树才是最优二叉树。WPL最小的就是霍夫曼树。
3、创建思路
- 从小到大进行排序, 将每一个数据,每个数据都是