1、堆的应用一:优先级队列(topN)
首先,我们来看第一个应用场景:优先级队列。优先级队列,顾名思义,它首先应该是一个队列。我们前面讲过,队列最大的特性就是先进先出。不过,在优先级队列中,数据的出队顺序不是先进先出,而是按照优先级来,优先级最高的,最先出队。
如何实现一个优先级队列呢?方法有很多,但是用堆来实现是最直接、最高效的。这是因为,堆和优先级队列非常相似。一个堆就可以看作一个优先级队列。很多时候,它们只是概念上的区分而已。往优先级队列中插入一个元素,就相当于往堆中插入一个元素;从优先级队列中取出优先级最高的元素,就相当于取出堆顶元素。
优先级队列,它的应用场景非常多。我们后面要讲的很多数据结构和算法都要依赖它。比如,赫夫曼编码、图的最短路径、最小生成树算法等等。不仅如此,很多语言中,都提供了优先级队列的实现,比如,Java 的 PriorityQueue,C++ 的 priority_queue 等。只讲这些应用场景比较空泛,现在,我举两个具体的例子,让你感受一下优先级队列具体是怎么用的。
import java.util.ArrayList;
import java.util.List;
import java.util.PriorityQueue;
import java.util.Queue;
/**
* java的PriorityQueue,其底层用的是堆(小顶堆)
* 遍历数组需要 O(n) 的时间复杂度,一次堆化操作需要 O(logK) 的时间复杂度,所以最坏情况下,n
* 个元素都入堆一次,时间复杂度就是 O(nlogK)。
* @author xpzhang
*
*/
public class HeapSort {
public static void main(String[] args) {
int[]array= {1,2,3,5,7,8};
System.out.println(getTopMapNum(array,1));
}
/**
* 获取一个数组中的第K大元素
* @param arr
* @param k
* @return
*/
public static List<Integer> getTopMapNum(int[] arr, int k) {
// 优先级队列
Queue<Integer> priorityQueue = new PriorityQueue();
List<Integer> topKList = new ArrayList<>();
if (arr == null || k > arr.length || k <= 0) {
return topKList;
}
for (int i : arr) {
if (priorityQueue.size() < k) {
priorityQueue.add(i);
} else if(priorityQueue.peek() < i){
// 从小顶堆里取数据,不删除,删除顶部数据,删除后小顶堆会堆化
priorityQueue.poll();
priorityQueue.add(i);
}
}
// 将数组中符合的第K大元素放入集合中
while (k-- > 0) {
topKList.add(priorityQueue.poll());
}
return topKList;
}
}
查找前 K 大数据呢?我们可以维护一个大小为 K 的小顶堆,顺序遍历数组,从数组中取出数据与堆顶元素比较。如果比堆顶元素大,我们就把堆顶元素删除,并且将这个元素插入到堆中;如果比堆顶元素小,则不做处理,继续遍历数组。这样等数组中的数据都遍历完之后,堆中的数据就是前 K 大数据了。