LeetCode: 347. 前 K 个高频元素(中等)

最新推荐文章于 2023-11-16 00:07:48 发布

LeetCode刷题记录

最新推荐文章于 2023-11-16 00:07:48 发布

阅读量192

点赞数

分类专栏： 91天学算法文章标签：队列算法数据结构 leetcode

本文链接：https://blog.csdn.net/qq_42147969/article/details/111746090

版权

91天学算法专栏收录该内容

31 篇文章 5 订阅

订阅专栏

题目描述

给定一个非空的整数数组，返回其中出现频率前 k 高的元素。

示例 1:
输入: nums = [1,1,1,2,2,3], k = 2 输出: [1,2]
示例 2:
输入: nums = [1], k = 1 输出: [1]

题解

排序算法 解题思路

首先遍历整个数组，并使用哈希表记录每个数字出现的次数，并形成一个[出现次数数组]。找出原数组的前 k 个高频元素，就相当于找出[出现次数数组]的前 k 大的值。
最简单的做法是给[出现次数数组]排序。但由于可能有 O(N) 个不同的出现次数（其中 N 为原数组长度），故总的算法复杂度会达到 O(NlogN)，不满足题目的要求。

在这里，我们可以利用堆的思想：建立一个小顶堆，然后遍历[出现次数数组]：

如果堆的元素个数小于 k，就可以直接插入堆中。
如果堆的元素个数等于 k，则检查堆顶与当前出现次数的大小。如果堆顶更大，说明至少有 k 个数字的出现次数比当前值大，故舍弃当前值；否则，就弹出堆顶，并将当前值插入堆中。

堆处理海量数据的 topK，非常合适，优先队列应用在元素优先级排序，比如本题的频率排序非常合适。

堆，优先队列有两个重要操作，时间复杂度均是 O(logk)。以小顶堆为例：

上浮 sift up: 向堆尾新加入一个元素，堆规模 +1，依次向上与父节点比较，如小于父节点就交换。
下沉 sift down: 从堆顶取出一个元素（堆规模 -1，用于堆排序）或者更新堆中一个元素（本题），依次向下与子节点比较，如大于子节点就交换。

对于 topk 问题：最大堆求topk小，最小堆求 topk 大。

topk小：构建一个 k 个数的最大堆，当读取的数小于根节点时，替换根节点，重新塑造最大堆
topk大：构建一个 k 个数的最小堆，当读取的数大于根节点时，替换根节点，重新塑造最小堆

疑问
堆的构造过程,代码实现?

class Solution {
public:
    // 自定义比较函数, 小顶堆
    class mycomparison {
    public:
        // pair 的第一个元素代表数组的值，第二个元素代表了该值出现的次数
        bool operator()(const pair<int, int>& lhs, const pair<int, int>& rhs) {
            return lhs.second > rhs.second;// 小的优先级高
        }
    };
    vector<int> topKFrequent(vector<int>& nums, int k) {
        // 要统计元素出现频率
        unordered_map<int, int> map; // map<nums[i],对应出现的次数>
        for (int i = 0; i < nums.size(); i++) {
            map[nums[i]]++;
        }

        // 对频率排序
        // 定义一个小顶堆，大小为k
        priority_queue<pair<int, int>, vector<pair<int, int>>, mycomparison> pri_que;
        
        // 用固定大小为k的小顶堆，扫面所有频率的数值 
        for (unordered_map<int, int>::iterator it = map.begin(); it != map.end(); it++) {
            pri_que.push(*it);
            if (pri_que.size() > k) { // 如果堆的大小大于了K，则队列弹出，保证堆的大小一直为k
                pri_que.pop();
            }
        }

        // 找出前K个高频元素，因为小顶堆先弹出的是最小的，所以倒叙来输出到数组
        vector<int> result(k);
        for (int i = k - 1; i >= 0; i--) {
            result[i] = pri_que.top().first;
            pri_que.pop();
        }
        return result;

    }
};

复杂度分析

时间复杂度：O(Nlogk)，其中 N 为数组的长度。我们首先遍历原数组，并使用哈希表记录出现次数，每个元素需要 O(1) 的时间，共需 O(N) 的时间。随后，我们遍历[出现次数数组]，由于堆的大小至多为 k，因此每次堆操作需要 O(logk) 的时间，共需 O(Nlogk) 的时间。二者之和为 O(Nlogk)。
空间复杂度：O(N)。哈希表的大小为 O(N)，而堆的大小为 O(k)，共计为 O(N)。

参考

347 前K个高频元素：【优先级队列-小顶堆】详解！
前 K 个高频元素
 化繁为简，清晰的小根堆实现讲解

LeetCode刷题记录

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
LeetCode: 347. 前 K 个高频元素(中等)

题目描述给定一个非空的整数数组，返回其中出现频率前 k 高的元素。示例 1:输入: nums = [1,1,1,2,2,3], k = 2 输出: [1,2]示例 2:输入: nums = [1], k = 1 输出: [1]题解解题思路首先遍历整个数组，并使用哈希表记录每个数字出现的次数，并形成一个[出现次数数组]。找出原数组的前 k 个高频元素，就相当于找出[出现次数数组]的前 k 大的值。最简单的做法是给[出现次数数组]排序。但由于可能有 O(N) 个不同的出现次数（其中
复制链接

扫一扫

专栏目录