先引入堆的概念以后对哈夫曼树可以更好的理解与操作。
什么是堆:优先队列,就是在一个队列中取出元素的顺序不是按照入队的先后顺序,而是数据的优先级。
堆的特性,堆是由数组表示的完全二叉树,物理上是用数组,但思维逻辑方向上还是链表。
如果任一节点值都大于其左右儿子则成为最大堆,反之为最小堆
typedef struct HeapStruct* MaxHeap
struct HeapStruct
{
ElementType *Elements; //储存堆元素的数组
int Size; //当前数组存储的元素数量
int Capacity; //数组总的容量
}
最大堆的创建
MaxHeap Create(int MaxSize)
{
MaxHeap *H=new MaxHeap;
H->Elements=new ElementType[MaxSize+1]
H->Size=0;
H->Capacity=MaxSize;
H->Elements[0]=MaxData; //定义哨兵,后面可以更好的操作
}
最大堆的插入
bool Insert( MaxHeap &H, ElementType X )
{ /* 将元素X插入最大堆H,其中H->Data[0]已经定义为哨兵 */
int i;
if ( IsFull(H) ) {
printf("最大堆已满");
return false;
}
i = ++H->Size; /* i指向插入后堆中的最后一个元素的位置 */
for ( ; H->Data[i/2] < X; i/=2 )
H->Data[i] = H->Data[i/2]; /* 上滤X */
H->Data[i] = X; /* 将X插入 */
return true;
}
最大堆的删除
ElementType DeleteMax( MaxHeap &H )
{ /* 从最大堆H中取出键值为最大的元素,并删除一个结点 */
int Parent, Child;
ElementType MaxItem, X;
if ( IsEmpty(H) ) {
printf("最大堆已为空");
return ERROR;
}
MaxItem = H->Data[1]; /* 取出根结点存放的最大值 */
/* 用最大堆中最后一个元素从根结点开始向上过滤下层结点 */
X = H->Data[H->Size--]; /* 注意当前堆的规模要减小 */
for( Parent=1; Parent*2<=H->Size; Parent=Child ) {
Child = Parent * 2;
if( (Child!=H->Size) && (H->Data[Child]<H->Data[Child+1]) )
Child++; /* Child指向左右子结点的较大者 */
if( X >= H->Data[Child] ) break; /* 找到了合适位置 */
else /* 下滤X */
H->Data[Parent] = H->Data[Child];
}
H->Data[Parent] = X;
return MaxItem;
}
哈夫曼树:带权路径长度(WPL)设二叉树有N个叶子节点,每个叶子节点带有权值Wk,从根节点到每个叶子节点的长度为Lk,则每个叶子节点的带权路径长度之和就是WPL=ΣWkLk
最优二叉树或哈夫曼树:WPL最小的二叉树