提示: 这节博客是在堆排序基础上延伸的,所以在阅读之前请先看一下堆排序相关知识。也可以看我写的堆排序博客
堆排序是一个优秀的算法,但是在实际应用中,将要介绍的快速排序性能一般会优于堆排序。尽管如此,堆这一数据结构仍然有很多应用。今天这个博客将要介绍堆的一个常见的应用:作为高效的优先队列。和堆一样,优先队列也有两种形式:最大优先队列和最小优先队列。
这里我们关注与如何基于最大堆实现最大优先队列。
优先队列(priority queue) 是一种用来维护由一组元素构成的集合S的数据结构,其中的每一个元素都有一个相关的值,称为关键字(key)。一个最大优先队列支持以下操作:
- INSERT(S,x) 把元素x插入集合S中。
- MAXIMUM(S): 返回S中具有最大键字的元素。
- EXTRACT_MAX(S): 去掉并返回S中的具有最大键字的元素。
- INCREASE_KEY(S,x,k): 将元素x的关键字增加到k,这里假设k的值不小于x的原关键字值。
最大优先队列的应用有很多,其中一个就是在共享计算机系统的作业调度。最大优先队列记录将要执行的各个作业以及它们之间的相对优先级。当一个作业完成或者被中断后,调度器调用EXTRACT_MAX从所有的等待作业中,选出具有最高优先级的作业来执行。在任何时候,调度器可以调用INSERT把一个新作业加入到队列中来。
相应地,最小优先队列支持的操作包括INSERT、MINIMUM、EXTEACT_MIN和DECREASE_KEY。最小优先队列可以被用于基于事件驱动的模拟器。队列中保存要模拟的事件,每个事件都有一个发生时间作为其关键字。事件必须按照发生的时间顺序来进行模拟,因为某一事件的模拟结果可能会触发对其它事件的模拟。在每一步,模拟程序调用EXTRACT_MIN来选择下一个要模拟的事件。每一个新事件产生时,模拟器通过调用INSERT将其插入最小优先队列中。
最小优先队列在以后深入学习后,我会进行知识的补充。
显然,优先队列可以使用堆来实现。对一个像作业调度或事件驱动模拟器这样的应用程序来说,优先队列的元素对应着应用程序中的对象。
现在,我们来讨论如何实现最大优先队列的操作。过程HEAP_MAXIMUM可以在Θ(1)时间内实现MAXIMUM操作。
HEAP_MAXIMUM
1. return A[1]
过程HEAP_EXTRACT_MAX实现EXTRACT_MAX 操作。它与HEAPSORT过程中的for循环体部分很相似。
HEAP_EXTRACT_MAX(A)
1. if A.heap_size<1
2. error "heap underflow"max
3. max=A[1]
4. A[1]=A[A.heap_size]
5. A.heap_size=A.heap_size-1
6. MAX_HEAP(A,1)
7. return max
HEAP_EXTRACT_MAX的时间复杂度为O(lgn)。因为除了时间复杂度为O(lgn)的MAX_HEAPIFY之外,它的其他操作都是常数阶的。
过程HEAP_INCREASE_KEY能够实现INCREASE_KEY的操作。在优先队列中,我们希望增加关键字的优先队列元素由对应的数组下标i来识别。这一操作首先需要将A[i]的关键字更新为新值。因为增大A[i]的关键字可能会违反最大堆的性质,所以上述操作采用了类似于INSERTION_SORT中插入循环的方式。
在HEAP_INCREASE_KEY的操作过程中,当前元素会不断地与其父结点进行比较,如果当前元素的关键字较大,则当前元素与其父结点进行交换。这一过程会不断重复,直到当前元素的关键字小于其父结点时终止,因为此时已经重新符合了最大堆的性质。
HEAP_INCREASE_KEY(A,i,key)
1. if key<A[i]
2. error "new key is smaller than current key"
3. A[i]=key
4. whileMAX_ i>1 and A[PARENT[i]]<A[i]
5. exchage A[i] with A[PARENT(i)]
6. i=PARENT[i]
在包含n个元素的堆上,HEAP_INCREASE_KEY的时间复杂度是O(lgn)。这是因为在算法第3行做了关键字更新的结点到根结点的路径长度为O(lgn)。
过程MAX_HEAP_INSERT能够实现INSERT操作。它的输入是要被插入到最大堆A中的新元素的关键字。MAX_HEAP_INSERT首先通过增加一个关键字为-∞的叶结点来扩产最大堆,然后调用HEAP_INCREASE_KEY为新结点设置对应的关键字,同时保持最大堆的性质。
MAX_HEAP_INSERT
1. A.heap_size=A.heap_size+1
2. A[A.heap_size]=-∞
3. HEAP_INCREASE_KEY(A,A.heap_size,key)
在包含n个元素的堆上,MAX_HEAP_INSERT的运行时间为O(lgn)
总之,在一个包含n个元素的堆中,所有的优先队列的操作都可以在O(lgn)时间内完成