赫夫曼:从树中一个结点到另一个结点之间的分支构成两个检点之间的路径,路径上的分支数目称做路径长度。树的路径长度就是从树根到每一结点的路径长度之和。
如果考虑到带权的结点,结点的带权的路径长度为从该结点到树根之间的路径长度与结点上权的乘积。假设有n个权值,构造一棵有n个叶子结点的二叉树,每个叶子结点带权Wk,每个叶子的路径长度为lk,其中带权路径长度WPL最小的二叉树称作赫夫曼树。也称“最优二叉树”。
赫夫曼算法的描述
1. 根据给定的n个权值{w1,w2,…,wn}构成n棵二叉树的集合F{T1,T2,…,Tn},其中每棵二叉树Ti中只有一个带权为wi根结点,其左右子树均为空。
2. 在F中选中选取两棵根结点的权值最小的树作为左右子树构造一棵新的二叉树,且置新的二叉树的根结点的权值为其左右子树上根结点的权值之和。
3. 在F中删除这两棵树,同时将新得到的二叉树加入F中。
4. 重复2和3步骤,直到F只含一棵树为止。这棵树便是赫夫曼树。
当然赫夫曼研究这个的目的主要是为了解决当年远距离通信的数据传输的最优化问题。