一、Huffman Tree 简介
- 给定n个权值作为n个叶子结点,构造一棵二叉树,若该树的带权路径长度(wpl)达到最小,称这样的二又树为最优二叉树,也称为哈夫曼树。
- 哈夫曼树是带权路径长度最短的树,权值较大的结点离根较近。
二、常见概念:
- 路径和路径长度:
在一棵树中,从一个结点往下可以达到的孩子或孙子结点之间的通路,称为路径。通路
中分支的数目称为路径长度。若规定根结点的层数为1,则从根结点到第L层结点的路径长度为L-1 - 结点的权:
若将树中结点赋给一个有着某种含义的数值,则这个数值称为该结点的权。 - 结点的带权路径长度:
从根结点到该结点之间的路径长度与该结点的权的乘积。 - 树的带权路径长度:
树的带权路径长度规定为所有叶子结点的带权路径长度之和,记为WPL( weighted path
length),权值越大的结点离根结点越近的二叉树才是最优二叉树。 - WPL最小的就是赫夫曼树。
三、构建哈夫曼树
1、步骤:
- 从小到大进行排序,将每一个数据,每个数据都是一个节点,每个节点都可
以看成是一颗最简单的二叉树。 - 取出根节点权值最小的两颗二叉树。
- 组成一颗新的二叉树,该新的二叉树的根节点的权值是前面两颗二叉树根节点权值的和。
- 再将这颗新的二叉树,以根节点的权值大小再次排序,不断重复1-2-3-4的步骤,直到数列中,所有的数据都被处理,就得到一颗赫夫曼树。
2、例子:
有一组数:13,7,8,3,29,6,1
排序后,得到:
1,3,6,7,8,13,29
需要注意的是哈夫曼树的形态不唯一,但是其WPL值是唯一确定的。
3、代码:
1)创建哈夫曼树的代码:
// 创建赫夫曼树的方法
/**
* @param arr 需要创建成霍夫曼树的数组
* @return 创建好后的霍夫曼树的root 结点
*/
public static Node createHuffmanTree(int[] arr) {
// 第一步:为了操作方便
// 1.遍历arr 数组
// 2.将arr 的每个元素构成一个Node
// 3.将Node 放到Arraylist中
List<Node> nodes = new ArrayList<Node>();
for (int value : arr) {
// 遍历数组
nodes.add(new Node(value));
}
// 我们处理的过程是一个循环的过程
while (nodes.size() > 1) {
// 最后还剩一个元素才停止
// 排序 从小到大
Collections.sort(nodes);
System.out.println("nodes = " + nodes);
// 取出根节点权值最小的两颗二叉树
// 1.取出权值最小的结点(二叉树)
Node leftNode = nodes.get(0);
// 2.取出权值第二小的结点(二叉树)
Node rightNode = nodes.get(1);
// 3.构建一颗新的二叉树
Node paren