1. 定义
给定N个权值作为N个叶子结点,构造一棵二叉树,若该树的带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树(Huffman Tree)。哈夫曼树是带权路径长度最短的树,权值较大的结点离根较近。
2.路径及其长度
在一棵树中,一个结点到另一个结点之间的通路,称为路径。而每经过一个结点,路径长度就加一。
3.权
权值就是指的一个节点的权重,比如把二叉树应用在编码中,权重就可以理解为码出现的概率。以值的形式存储在结点中,通常为整型。
4.带权路径长度
指从根结点到该结点之间的路径长度与该结点的权的乘积。
5.构建哈夫曼树
在n个结点中,我们可以如下构建哈夫曼树
1.在 n 个权值中选出两个最小的权值,对应的两个结点组成一个新的二叉树,且新二叉树的根结点的权值为左右结点权值的和;
2.然后在原有的 n 个权值中删除那两个最小的权值,同时将新的权值加入到 n–2 个权值的行列中,但注意其结点依然存在以此类推;
重复 1 和 2 ,直到所以的结点构建成了一棵二叉树,哈夫曼树就构建完毕了。