PriorityQueue<int[]> queue = new PriorityQueue<int[]>(new Comparator<int[]>() {
public int compare(int[] m, int[] n) {
return m[1] - n[1];
}
}); //最小堆
for (Map.Entry<Integer, Integer> entry : occurrences.entrySet()) {//遍历键值对
int num = entry.getKey(), count = entry.getValue();
if (queue.size() == k) {
if (queue.peek()[1] < count) {
queue.poll();
queue.offer(new int[]{num, count});
}
} else {
queue.offer(new int[]{num, count});
}
}
这段代码是一个用于找出出现频率前 k 高的元素的算法,使用了最小堆的数据结构。以下是对代码的解释:
1. **数据结构选择:** 使用了一个 `PriorityQueue`,这是Java中的优先队列,默认情况下是一个最小堆。最小堆的性质是堆顶元素最小,适用于找出频率前 k 高的元素。
2. **Comparator定义:** 在创建 `PriorityQueue` 的时候,通过传递一个自定义的 `Comparator` 对象来定义元素比较的规则。这里的比较规则是基于元素的出现频率,即数组的第二个元素。如果第二个元素较小,就意味着该元素的频率较高,因此在最小堆中应该排在前面。
3. **遍历HashMap:** 代码通过遍历一个存储了元素出现次数的 `HashMap`,对于每个键值对(元素和其出现次数),执行以下操作:
- 如果最小堆的大小已经达到 k,比较堆顶元素的频率与当前元素的频率。
- 如果堆顶元素频率较小,说明堆中的元素不是前 k 高的,可以将堆顶元素弹出,然后将当前元素加入堆中。
- 如果最小堆的大小还没有达到 k,直接将当前元素加入堆中。
4. **最终结果:** 遍历完成后,最小堆中的元素就是出现频率前 k 高的元素。堆顶元素是最小的,但它是堆中频率最高的元素,而堆中其他元素都比它的频率低。
这种算法的时间复杂度是 O(n * log(k)),其中 n 是HashMap的大小。这是因为堆的大小是 k,对于每个元素,插入或弹出操作的时间复杂度是 log(k)。