找出一个非空数组中前K个出现频率最高的元素,要求复杂度小于O(nlogn).
依照频率来排列元素,带有明显的绑定意思,所以pair, map这种数据结构可以成为统计频率时候的容器,然后可以用heap或者说是priority queue来实现排序。
初步尝试不会,看的leetcode论坛:
vector<int> topKFrequent(vector<int>& nums, int k) {
priority_queue<pair<int, int>, vector<pair<int, int>>, greater<pair<int, int>>> minHeap;
vector<int> v;
map<int, int> counters;
for(int i = 0; i < nums.size(); ++i) counters[nums[i]]++;
// 此处O(n)的过程统计完所有频率存到counter里
for(auto& pair: counters) {
minHeap.push({pair.second, pair.first});
if(minHeap.size() > k) minHeap.pop();
//其实用maxheap也可以,但会慢一些,因为这始终保持k大小的queue,方便后续进来排序
}
while(!minHeap.empty()) {
v.push_back(minHeap.top().second);
minHeap.pop();
}
return v;
}
priority queue的好处就是方便对带有两个值,key and value 的pair类型结构体进行排序以及push and pop的操作,所以符合此处需要。
这题最好的做法是基于hash table, 稍后会进一步更新。
update:
map本身基于二叉树或者准确的说是红黑树实现的,不允许重复的key, 默认按照从小到大对key 排序。
默认参数为:< key, value, less > 第三个compare函数可以重载。
这题不需要用到map, 因为如果只是统计频率,基于hash table 是最省事的。所以用unordered_map.
之后的排序问题,还是用priority_queue 进行。因为可以允许key重复。
class Solution {
public:
vector<int> topKFrequent(vector<int>& nums, int k) {
unordered_map<int, int> hash;
for (auto m : nums) {
hash[m]++;
}
priority_queue<pair<int, int>> pq;
for (auto m : hash) {
pq.push({m.second, m.first});
}
vector<int> res;
for (int i = 0; i < k; i++) {
res.push_back(pq.top().second);
pq.pop();
}
return res;
}
};
方法三:
这题还可以使用类似桶排序的方法。将统计完频率哈希表依次遍历,用出现频率当坐标排列到bucket中,然后从后往前遍历bucket。
class Solution {
public:
vector<int> topKFrequent(vector<int>& nums, int k) {
unordered_map<int, int> hash;
for (auto m : nums) {
hash[m]++;
}
vector<int> res;
vector<vector<int>> bucket(nums.size() + 1);
for (auto m : hash) {
bucket[m.second].push_back(m.first);
}
int count = 0;
for (int i = nums.size(); i >= 0; i--) {
for (int j = 0; j < bucket[i].size(); j++) {
if (count < k) {
res.push_back(bucket[i][j]);
count++;
}
}
}
return res;
}
};