-1. 什么是树
树是一种 有层次关系的 数据结构。它由结点组成。
图一:
树的结点由 数据域 和 子结点域 组成。数据域 作为数据的容器;子结点域 存放 子结点 的地址。一个结点是它的子结点的父结点。不同层级之间的结点通过 子结点域 形成 “父子关系”。
每个结点有零个或多个子结点;没有父结点的结点称为根结点;每一个非根结点有且只有一个父结点;没有 子结点的结点称为叶结点。
图一中的结点A 就是根结点。B、C是 A 的子结点。C、E、F三个结点组成了一个子树。E也是一个子树。D、E、F都是叶结点。
如果一个结点有 n 个子结点,那么这个 结点的度 是 n 。如果一个树中的结点的度的最大值是 n ,那么这个 树的度 是 n。
对于一个树中的任意两个不同的结点,如果从一个结点出发,按层次 自上而下 沿着一个个结点能到达另一结点,称它们之间存在着一条 路径。
根结点的 层次数 为1,每个结点的 层次数 都等于其父结点的 层次数 加一。
如果一个树中的结点的层次的最大值为 n,则这个树的 深度 为 n。
特别地,度为 2 的树称为 二叉树。
二叉树的结点类:
public class TreeNode {
public Object data; //数据域
public TreeNode left; //左子结点域
public TreeNode right; //右子结点域
}
0. 什么是哈夫曼树
哈夫曼树 (Huffman Tree,霍夫曼树,最优二叉树) 是一种二叉树。哈夫曼树是一种带权路径长度最短的树。
权 是与树的结点关联的一个实数,用 W 表示。非叶结点的 权 等于其各子结点的 权 的和。一个结点的 路径长度 是这个结点与根结点的层次数之差,也就是该结点的层次数减 1,用 l 表示。
结点的带权路径长度 为:从根结点到该结点之间的路径长度与该结点的权的乘积。
一个二叉树中的各个 叶结点 的 带权路径长度 之和为 树的带权路径长度 ,用WPL表示,即:
下图就是一个哈夫曼树。方框中的数表示结点的权。
下面这个树的带权路径长度 为
WPL = 12 × 3 + 14 × 2 + 21 × 2 + 33 × 2 = 172 。