注:
题目:
给你一个整数数组 nums 和一个整数 k ,请你返回其中出现频率前 k 高的元素。你可以按 任意顺序 返回答案。
示例 1:
输入: nums = [1,1,1,2,2,3], k = 2
输出: [1,2]
示例 2:
输入: nums = [1], k = 1
输出: [1]
提示:
1 <= nums.length <= 105
k 的取值范围是 [1, 数组中不相同的元素的个数]
题目数据保证答案唯一,换句话说,数组中前 k 个高频元素的集合是唯一的
进阶:
你所设计算法的时间复杂度 必须 优于 O(n log n) ,其中 n 是数组大小。
题解:
思路与算法
首先遍历整个数组,并使用哈希表记录每个数字出现的次数,并形成一个「出现次数数组」。找出原数组的前 k 个高频元素,就相当于找出「出现次数数组」的前 k 大的值。
最简单的做法是给「出现次数数组」排序。但由于可能有 O(N) 个不同的出现次数(其中 N 为原数组长度),故总的算法复杂度会达到 O(NlogN),不满足题目的要求。
在这里,我们可以利用堆的思想:建立一个小顶堆,然后遍历「出现次数数组」:
- 如果堆的元素个数小于 k,将当前访问的元素直接插入堆中。
- 如果堆的元素个数等于 k,则将当前访问的元素插入到堆中,之后弹出堆顶。
遍历完成后,堆中的元素就代表了「出现次数数组」中前 k 大的值。
复杂度分析
时间复杂度:O(Nlogk),其中 N 为数组的长度。我们首先遍历原数组,并使用哈希表记录出现次数,每个元素需要 O(1) 的时间,共需 O(N) 的时间。随后,我们遍历「出现次数数组」,由于堆的大小至多为 k,因此每次堆操作需要 O(logk) 的时间,共需 O(Nlogk) 的时间。二者之和为 O(Nlogk)。
空间复杂度:O(N)。哈希表的大小为 O(N),而堆的大小为 O(k),共计为 O(N)。
class Solution {
public:
class compare{
public:
bool operator() (pair<int,int> &lhs,pair<int,int> &rhs){
return lhs.second>rhs.second;
}
};
vector<int> topKFrequent(vector<int>& nums, int k) {
map<int,int> mp;
vector<int> result(k);
for(auto i:nums){
mp[i]++;
}
priority_queue<pair<int,int>,vector<pair<int,int>>,compare> prique;
for(pair<int,int> p:mp){
if(prique.size()<k){
prique.push(p);
}
else{
prique.push(p);
prique.pop();
}
}
for(int i=k-1;i>=0;i--){
result[i]=prique.top().first;
prique.pop();
}
return result;
}
};