1. 什么是 TopK 问题?
给一个无序的数组,长度为N, 输出最小(或最大)的K个数。
2. TopK 问题分析思路
在求解 TopK 问题时, 使用堆是最佳方法.
若采用其他排序方法, 需要将数组全部重新排序一遍, 时间复杂度和空间复杂度会很大, 所以不建议采用其他排序方法
注意事项:
- 如果要输出前 k 个最小的元素, 应该建立一个大小为 k 的大根堆
- 如果要输出前 k 个最大的元素, 应该建立一个大小为 k 的小根堆
下面以输出前 k 个最小元素为例进行分析:
例如: 有一组数据为 :[6, 1, 2, 7, 9, 3, 4, 5, 10, 8], 输出前4个最小的元素.
分析: 由于输出的是最小的元素, 因此应该将数组的前 4 个元素建立成一个大根堆.
- 从第 k 个下标的数组元素开始, 让其与堆顶元素进行比较
- 若数组元素 < 堆顶元素, 就将堆顶元素删除, 让数组元素进入堆中, 再将堆调整成一个大根堆
- 若数组元素 >= 堆顶元素, 就继续比较下一个数组元素.
这样就保证了这个堆中始终存放的都是最小的元素.
代码如下:
public class TopK {
public static int[] topK(int[] array, int k) {
// priorityQueue 底层是一个小根堆, 通过比较器, 将其底层转变成一个大根堆
PriorityQueue<Integer> priorityQueue = new