文章目录
基本思想
堆排序是一种基于完全二叉树结构的排序算法,其基本思想是将待排元素构建成一个二叉堆,然后依次取出堆顶的最大元素,并将剩余元素重新调整为一个新的最大堆,如此重复,直至排序完成。
具体讲解参考UP大大:有个知识 五分钟认识堆排序_哔哩哔哩_bilibili
实现代码
力扣347:
347. 前 K 个高频元素 - 力扣(LeetCode)
建立一个小顶堆,然后遍历「出现次数数组」:
- 如果堆的元素个数小于 k,就可以直接插入堆中。
- 如果堆的元素个数等于 k,则检查堆顶与当前出现次数的大小。如果堆顶更大,说明至少有 k个数字的出现次数比当前值大,故舍弃当前值;否则,就弹出堆顶,并将当前值插入堆中。
遍历完成后,堆中的元素就代表了「出现次数数组」中前 k大的值。
class Solution {
public:
static bool cmp(pair<int, int>& m, pair<int, int>& n) {
return m.second > n.second;//用小顶堆,从左到右为从大到小,可以把最小的pop出去
}
vector<int> topKFrequent(vector<int>& nums, int k) {
unordered_map<int, int> occurrences;
//记录元素出现次数
for (auto& v : nums) {
occurrences[v]++;
}
// pair 的第一个元素代表数组的值,第二个元素代表了该值出现的次数
//装载类型 装载容器 比较方式
//decltype(&cmp)` 表示使用 `cmp` 函数的类型,decltype用于获取表达式的类型
//q(cmp)` 表示创建一个 `priority_queue` 对象 `q`,
//并使用函数 `cmp` 作为比较规则来初始化这个对象
priority_queue<pair<int, int>, vector<pair<int, int>>, decltype(&cmp)> q(cmp);
//遍历`occurrences` 中的每个键值对,将键赋值给 `num`,将值赋值给 `count`。
for (auto& [num, count] : occurrences) {
if (q.size() == k) {
if (q.top().second < count) {
q.pop();
q.emplace(num, count);
}
} else {
//把pair类型的(num, count)插入优先队列,并使用cmp排序
q.emplace(num, count);
}
}
vector<int> ret;
while (!q.empty()) {
ret.emplace_back(q.top().first);
q.pop();
}
return ret;
}
};
本题的优先队列思路可以参考-C++ 力扣347. 前 K 个高频元素 ;使用优先队列(可以以较短时间内进行排序)_哔哩哔哩_bilibili
优化
时空复杂度
- 时间复杂度:O(Nlogk)O(N\log k)O(Nlogk),其中 NNN 为数组的长度。我们首先遍历原数组,并使用哈希表记录出现次数,每个元素需要 O(1)O(1)O(1) 的时间,共需 O(N)O(N)O(N) 的时间。随后,我们遍历「出现次数数组」,由于堆的大小至多为 kkk,因此每次堆操作需要 O(logk)O(\log k)O(logk) 的时间,共需 O(Nlogk)O(N\log k)O(Nlogk) 的时间。二者之和为 O(Nlogk)O(N\log k)O(Nlogk)。
- 空间复杂度:O(N)O(N)O(N)。哈希表的大小为 O(N)O(N)O(N),而堆的大小为 O(k)O(k)O(k),共计为 O(N)O(N)O(N)。