1. 堆的定义
理解堆的一个很好的例子就是我们的足球世界杯的赛制!我们的足球世界杯的赛制就是自底向上的。
堆是一棵完全二叉树,树中每个结点的值都不小于(或不大于)其左右孩子结点的值。
- 如果父亲结点的值大于或等于孩子结点的值,那么称这样的堆为大顶堆;
- 如果父亲结点的值小于或等于孩子结点的值,那么称这样的堆为小顶堆。
堆一般用于优先队列priority_queue
的实现,而优先队列默认情况下使用的是大顶堆,因此本节以大顶堆为例,以下出现的堆均指大顶堆。
下面给出一个大顶堆的实例:
那么,对一个给定的初始序列,怎样把它建成一个堆呢?
至此,建堆就完成了。那么具体怎么实现呢?
2. 堆的基本操作
2.1 数据结构——静态链表
对完全二叉树来说,比较简洁的实现方法就是按照在前面说的,使用数组来储存完全二叉树。
这样结点就按层序存储在了数组中(⭐⭐⭐⭐⭐妙呀!!! )。其中第一个结点将存储在数组的1号位(在前面的章节中讲解过要设置起点为1),并且数组i
号位表示的结点的左孩子就是2i
号位,而右孩子则是(2i+1)
号位。于是可以像下面这样定义数组来并表示堆:
const int maxn = 100;
//heap为堆,n为元素个数
int heap[maxn],n = 10;
2.2 向下调整⭐⭐⭐⭐⭐
回顾之前的建堆过程会发现,每次调整都是把结点从上往下的调整。
针对这种向下调整,调整方法是这样的:
- 总是把当前结点
V
与它的左右孩子比较(如果有的话),假如孩子中存在权值比结点V
的权值大的,就将其中权值最大的那个孩子结点与结点V
交换; - 交换完毕后继续让结点
V
和孩子比较,直到结点V
的孩子的权值都比结点V
的权值小或是结点V
不存在孩子结点。
于是很容易可以写出向下调整的代码,显然时间复杂度为 O ( l o g n ) O(logn) O(logn)。
//对heap数组在[low,high]范围进行向下调整
//其中low为欲调整结点的数组下标,high一般为堆的最后一个元素的数组下标
void downAdjust(int low,int high){
int i = low;
int j = i * 2; //i为欲调整结点,j初始化为其左孩子
while(j <= high){ //存在左孩子
//如果右孩子存在,且右孩子的值大于左孩子
if(j + 1 <= high && heap[j+1] > heap[j]){
j = j + 1; //让j存储右孩子下标
}
//如果孩子中最大的权值比欲调整结点i大
if(heap[j] > heap[i]){
swap[heap[j],heap[i]]; //交换最大权值的孩子与欲调整结点i
i = j; //保持i为欲调整结点、j为i的左孩子
j = i * 2;
} else{
break; //孩子的权值均比欲调整结点i小,调整结束
}
}
}
2.3 建堆——自下而上,自右到左
那么建堆的过程也就很容易了。假设序列中元素的个数为n
,于是可以从
n
2
\frac n 2
2n 的下界开始倒着枚举结点,对每个遍历到的结点i
进行[i,n]
范围的调整。
建堆的代码如下,时间复杂度为
O
(
n
)
O(n)
O(n)(证明可参考《算法导论》)
//建堆
void createHeap(){
for(int i = n/2;i >= 1;i--){
downAdjust(i,n);
}
}
2.4 删除堆顶元素——向下调整
另外,如果要删除堆中的最大元素(也就是删除堆顶元素),并让其仍然保持堆的结构,那么只需要最后一个元素覆盖堆顶元素,然后,然后对根结点进行向下调整即可。代码如下:时间复杂度为 O l o g ( n ) Olog(n) Olog(n)。
//删除堆顶元素
void deleteTop(){
heap[1] = heap[n--]; //用最后一个元素覆盖堆顶元素,并将元素个数减1
downAdjust(1,n); //向下调整堆顶元素
}
- 注意:n要记得减1
2.5 增加一个元素——往上调整
那么,如果想要往堆里添加一个元素,应当怎么办呢?可以把想要添加的元素放到数组最后(也就是完全二叉树的最后一个结点后面),然后进行 向上调整操作。
向上调整总是把欲调整结点与父亲结点比较,如果权值比父亲结点大,那么就交换其与父亲结点,这样反复比较,直到达到堆顶或是父亲结点权值较大为止。往上调整的代码如下,时间复杂度为 O ( l o g n ) O(logn) O(logn)
//对heap数组在[low,high]范围进行向上调整
//其中low一般设置为1,high表示欲调整结点的数组下标
void upAdjust(int low,int high){
int i = high; //i为欲调整结点
int j = i / 2; //j为其父亲
while(j >= low){ //父亲在[low,high]范围内
//父亲权值小于欲调整结点i的权值
if(heap[j] < heap[i]){
swap(heap[j],heap[i]);
i = j;
j = i / 2;
}else{
break;
}
}
}
在此基础上就很容易实现添加元素的代码了:
//添加元素x
void insert(int x){
heap[++n] = x;
upAdjust(1,n);
}
3. 堆排序
堆排序是指使用堆结构堆一个序列进行排序。此处讨论递增排序(想想为啥是递增)的情况。
考虑对一个堆而言,堆顶元素是最大的,因此在建堆完毕后,堆排序的直观思路就是取出堆顶元素,然后将堆的最后一个元素替换至堆顶,在进行一次针对堆顶元素的向下调整——如此重复,直到堆中只有一个元素为止。
//堆排序
void heapSort(){
createHeap(); //建堆
for(int i=n;i > 1;i--){ //注意边界是1
swap(heap[i],heap[1]);
downAdjust(1,i-1);
}
}
- 注意:边界是大于1;
4. 题型训练
- 【PAT A1098】Insertion or Heap Sort
- 【堆排序】LeetCode 215. Kth Largest Element in an Array
- 【分类思想+堆】LeetCode 373. Find K Pairs with Smallest Sums
- LeetCode 347. Top K Frequent Elements
- LeetCode 378. Kth Smallest Element in a Sorted Matrix
- PAT A1147 Heaps
5. 应用场景⭐⭐⭐⭐⭐
- 只要涉及到了前K个最优值的问题,一般都要想到堆 。(注意是堆,而不是堆排序!比如这个题目用的是堆,而不是堆排序,它们时间复杂度是有区别的。)
我觉得这句话说的有道理,因为堆恰好能每次求一个最值,而不像其他排序算法要全部排完才行!所以堆比较节约时间了。