何为堆?
-
堆(heap):一类特殊的数据结构的统称。堆通常是一个可以被看做一棵树的数组对象。
-
堆总是满足下列性质:
- 有序性:堆中某个节点的值总是不大于或不小于其父节点的值;
- 结构性:堆总是一棵完全二叉树。
-
将根节点最大的堆叫做最大堆或大根堆,根节点最小的堆叫做最小堆或小根堆。
举例:
注意:从根结点到任意结点路径上结点序列都具有有序性!
2.堆的抽象数据类型描述
3.堆的基本操作(以具体堆为例)
下面以具体代码介绍堆的基本操作,给出了基本思想,代码中含具体注释。
3.1 堆的结构体定义
struct Heap
{
int* data;//存储元素的数组
int Size;//当前元素个数
int Capcity;//堆的最大容量
};
3.2 创建空堆
//创建容量为maxSize的为空的最大堆
Heap* create_max_heap(int maxSize) {
Heap* maxHeap = new Heap;
maxHeap->data = new int[maxSize+1];//堆的下标从1开始,原因:相当于用数组存完全二叉树
maxHeap->Size = 0;
maxHeap->Capcity = maxSize;
maxHeap->data[0] =INT_MAX;
//定义“哨兵”为大于堆中所有可能元素的值,便于以后更快操作
return maxHeap;
}
3.3 向最大堆中插入元素
基本思想
- 怎么插,插到哪?
把新元素放入数组(堆)的最后一个位置,如下图的【6】那里 - 插入之后怎么保证堆的有序性?
不断与父节点比较大小,如果不符合堆的有序性就与父节点交换位置。不断比较,直到找到最终位置
- 例如在上述最大堆中插入“58”元素:
代码实现
//向最大堆中插入元素data,其中maxHeap[0]已经定义为哨兵
void insert_max_heap(int data, Heap* maxHeap) {
if (maxHeap->Size == maxHeap->Capcity) {
cout << "堆已满" << endl;
return;
}
int i = maxHeap->Size + 1 ; //i指向插入后堆中的最后一个元素的位置
maxHeap->Size++;//将堆的大小加1
//不断与父节点data[i/2]进行比较,直到找到一个父节点比它大
for (; maxHeap->data[i / 2] < data; i = i / 2) {
maxHeap->data[i] = maxHeap->data[i / 2];
//向下过滤节点(比新元素小的父节点往下移)
}
//找到新元素应有的位置,并赋值
maxHeap->data[i] = data;
}
时间复杂度
T (N) = O ( log N )
3.4最大堆的删除
删除操作结果:取出根结点(最大值)元素,同时删除堆的一个结点。
基本思想
-
怎么删除,删除哪一个结点?
取出根节点,删除最后一个结点(为保持二叉树的结构性),把最后一个结点的元素移到根节点。如下图,取出根节点【58】,把【31】移动到根节点,删除最后一个结点。
-
第一步保持了堆的结构性,但有序性无法保证,接着维持有序:
将新的根节点与左右节点中值最大的那个节点比较,不断交换,直到有序。
流程如下图所示:
将31与44和25中大的那个——44比较,发现44大,44上去,31下来;然后35又大,31继续下去。
代码实现
//在最大堆maxHeap中删除最大值,并放回该值
int delete_max(Heap* &maxHeap) {
if (maxHeap->Size == 0)
{
cout << "堆空!" << endl;
return -1;
}
//将堆的最后一个元素保存
int temp = maxHeap->data[maxHeap->Size];
maxHeap->Size--;
int ans = maxHeap->data[1];
int parent = 1;
int child;
/*for循环:用最大堆中最后一个元素从根节点开始向上过滤下层结点,就是为它找一个位置*/
for (; parent * 2 <= maxHeap->Size; parent = child) {
child = parent * 2;//child指向parent左孩子
/*下面这个if将:child指向parent两孩子结点中值最大的那个*/
if (child != maxHeap->Size //判断parent是否存在右孩子
&& maxHeap->data[child + 1] > maxHeap->data[child])//
{
child = child + 1;
}
if (temp >= maxHeap->data[child])//位置找到了
{
break;
}
else
maxHeap->data[parent] = maxHeap->data[child];
}
//最后赋值
maxHeap->data[parent] = temp;
return ans;//放回删除的最大值
}
时间复杂度
T (N) = O ( log N )
3.5 最大堆的建立问题
- 目的:将已经存在的N个元素按最大堆的要求存放在 一个一维数组中
- 实现——两种方法
- 通过插入操作,将N个元素一个个相继插入到一个初 始为空的堆中去,其时间代价最大为O(N logN)。
- 在线性时间复杂度(O(n))下建立最大堆。
(1)将N个元素按输入顺序存入,先满足完全二叉树的结构特性
(2)调整各结点位置,以满足最大堆的有序特性。
方法一
方法一直接循环插入就好了:
//用插入建造一个堆
void Build_Heap(int list[], int size) {
Heap* maxHeap = create_max_heap(size);
for (int i = 0; i < size; i++)
insert_max_heap(list[i], maxHeap);
}
方法二
方法二中关键是调整,这与堆的删除操作很相似。
- 我们先分析下堆的删除操作:
堆的删除操作是将最后一个结点移到根节点,然后下滤调整。
其中:当最后一个结点移到根节点时,有一个特征——其左右子树都是堆。实际上,我们在堆里面执行最多的一个操作是:已知左边是一个堆,右边是一个堆,又新来了一个元素,怎么把它调成一个堆(方法就是前面堆的删除用到的方法)。堆的建立也是用到了这个方法 - 我们再看如何在建堆的过程中用上面的方法:
在开始的时候 “将N个元素按输入顺序存入,先满足完全二叉树的结构特性 ”,这个时候元素是杂乱放入的,左边可能不是个堆,右边也不是一个堆。那怎么办?
我们从底下开始,从倒数第一个有儿子的节点开始,对于这个节点,其左右子树最多只有一个儿子,那么其左右子树一定是一个堆。(如下图,从87节点开始,其左右子树都满足堆的特性) - 就这样一直“从下到上”不断调整,直到调到根节点