一、背景介绍
堆就是用数组实现的二叉树,所以它没有使用父指针或者子指针。堆根据“堆属性”来排序,“堆属性”决定了树中节点的位置。
堆的常用方法:
- 构建优先队列
- 支持堆排序
- 快速找出一个集合中的最小值(或者最大值)
堆分为两种:最大堆和最小堆,两者的差别在于节点的排序方式。
在最大堆中,父节点的值比每一个子节点的值都要大。在最小堆中,父节点的值比每一个子节点的值都要小。这就是所谓的“堆属性”,并且这个属性对堆中的每一个节点都成立。
这是一个最大堆,,因为每一个父节点的值都比其子节点要大。10
比 7
和 2
都大。7
比 5
和 1
都大。
根据这一属性,那么最大堆总是将其中的最大值存放在树的根节点。而对于最小堆,根节点中的元素总是树中的最小值。堆属性非常的有用,因为堆常常被当做优先队列使用,因为可以快速的访问到“最重要”的元素。
注意:堆的根节点中存放的是最大或者最小元素,但是其他节点的排序顺序是未知的。例如,在一个最大堆中,最大的那一个元素总是位于 index 0 的位置,但是最小的元素则未必是最后一个元素。--唯一能够保证的是最小的元素是一个叶节点,但是不确定是哪一个。
二、实例
给定一个非空的整数数组,返回其中出现频率前 k 高的元素?
示例
输入: nums = [1,1,1,2,2,3], k = 2
输出: [1,2]
解题步骤:
1、利用hashmap统计元素出现的频次,建立元素与频次之间的映射
2、创建元素个数为k的小顶堆优先队列
3、遍历hashmap, 当优先队列中元素个数小于k时,直接加入优先队列
4、如果优先队列中元素个数等于k时,新元素的频次与堆顶元素频次比较,如果比堆顶元素频次高,pop出堆顶元素,然后再push新的元素,如果比堆顶元素频次还要低,则不处理
5、最后使用数组保存频次前k的元素
时间复杂度
统计频率,需要遍历一遍数组,所需要的时间复杂度为O(n), hashmap的插入、查找的时间复杂度为O(1), 所以统计频率过程时间复杂度为O(n).
遍历hashmap的时间复杂度时间复杂度O(n),维护元素个数为k的小顶堆时间复杂度为O(logk), 这个过程时间复杂度为O(nlogk).
把优先队列转换为数组时间复杂度为O(k).
综上所述,整体时间复杂度为 O(nlogk).
空间复杂度
创建hashmap,最坏情况,当没有相同元素时,复杂度为O(n)
小顶堆空间复杂度为O(k)
保存频率前k的元素数组,复杂度O(k)
综上,空间复杂度为O(n)
解答:
typedef pair<int, int> IIPair;
struct cmp {
bool operator()(const IIPair &left, const IIPair &right) const
{
return left.second > right.second;
}
};
vector<int> topKFrequent(vector<int>& nums, int k) {
unordered_map<int, int> mp;
for (auto i : nums) {
mp[i]++;
}
priority_queue<IIPair, vector<IIPair>, cmp> q; // 创建一个小顶堆
for (auto item : mp) {
if (q.size() < k) {
q.push(item);
} else if (item.second > q.top().second) {
q.pop();
q.push(item);
}
// 新的元素频次小于堆顶元素频次的元素不处理。
}
vector<int> ret(q.size(), 0);
while (!q.empty()) {
ret[q.size()-1] = q.top().first;
q.pop();
}
return ret;
}