347. 前 K 个高频元素
给你一个整数数组 nums
和一个整数 k
,请你返回其中出现频率前 k
高的元素。你可以按 任意顺序 返回答案。
例如,nums = [1,1,1,2,2,3]
,k = 2
,nums
中1
出现了3
次,2
出现了2
次,3
出现了1
次,所以前2
个高频元素是1
和2
,因此输出[1,2]
。
提示:
1 <= nums.length <= 10^5
k
的取值范围是[1, 数组中不相同的元素的个数]
- 题目数据保证答案唯一,换句话说,数组中前
k
个高频元素的集合是唯一的
进阶:你所设计算法的时间复杂度 必须 优于 O(n log n)
,其中 n
是数组大小。
哈希表+小顶堆
哈希表记录每个数字出现的次数。小顶堆按照次数升序排序,所有元素都过一遍堆,堆里只存k
个元素。
class Solution {
public int[] topKFrequent(int[] nums, int k) {
// 记录每个数字出现的次数
Map<Integer, Integer> occurrences = new HashMap<>();
for (int num : nums) {
occurrences.put(num, occurrences.getOrDefault(num, 0) + 1);
}
// 使用优先队列(小顶堆),int[] 的第一个元素代表数组的值,第二个元素代表该值出现的次数
PriorityQueue<int[]> queue = new PriorityQueue<>(new Comparator<int[]>() {
public int compare(int[] m, int[] n) {
return m[1] - n[1]; // 比较次数,按次数升序排序
}
});
// 遍历 occurrences 映射中的每个条目,将其添加到优先队列中
for (Map.Entry<Integer, Integer> entry : occurrences.entrySet()) {
int num = entry.getKey();
int count = entry.getValue();
// 如果优先队列已经有 k 个元素
if (queue.size() == k) {
// 如果当前数的频率大于优先队列的堆顶元素(最小频率),则替换堆顶元素
if (queue.peek()[1] < count) {
queue.poll(); // 移除堆顶元素
queue.offer(new int[]{num, count}); // 添加当前数及其频率
}
} else {
// 如果优先队列还没有 k 个元素,直接添加当前数及其频率
queue.offer(new int[]{num, count});
}
}
// 提取优先队列中的元素,将其存入结果数组中
int[] ret = new int[k];
for (int i = 0; i < k; ++i) {
ret[i] = queue.poll()[0]; // 取出优先队列的堆顶元素的值(频率最高的前 k 个元素)
}
return ret; // 返回结果数组
}
}
- 时间复杂度: O ( N log k ) O(N \log k) O(Nlogk) ,其中 N N N 为数组的长度。我们首先遍历原数组,并使用哈希表记录出现次数,每个元素需要 O ( 1 ) O(1) O(1) 的时间,共需 O ( N ) O(N) O(N) 的时间。随后,我们遍历「出现次数数组」,由于堆的大小至多为 k k k ,因此每次堆操作需要 O ( log k ) O(\log k) O(logk) 的时间,共需 O ( N log k ) O(N \log k) O(Nlogk) 的时间。二者之和为 O ( N log k ) O(N \log k) O(Nlogk) 。
- 空间复杂度: O ( N ) O(N) O(N) 。哈希表的大小为 O ( N ) O(N) O(N) ,而堆的大小为 O ( k ) O(k) O(k) ,共计为 O ( N ) O(N) O(N) 。