leetcode347-前k个高频元素

Emperorist

已于 2022-03-23 00:55:30 修改

阅读量1.1k

点赞数

分类专栏：哈希表文章标签：数据结构算法 leetcode

于 2022-03-22 19:51:10 首次发布

本文链接：https://blog.csdn.net/weixin_42127177/article/details/123669407

版权

哈希表专栏收录该内容

3 篇文章 0 订阅

订阅专栏

给你一个整数数组 nums 和一个整数 k ，请你返回其中出现频率前 k 高的元素。你可以按任意顺序返回答案。
在这里插入图片描述

方法一：哈希表+排序

将数组中每个元素出现的次数存入哈希表中，对哈希表进行排序，取前k个元素即为题目要求的前k个高频元素。

class Solution {
public:
    vector<int> topKFrequent(vector<int>& nums, int k) {
        int count=0;
        vector<int>vec;
        unordered_map<int, int>map;
        for (int i = 0; i < nums.size(); ++i)
        {
            map[nums[i]]++;
        }
        vector<pair<int, int>> b;     //非常关键，因为unordered_map，map本身不支持sort，将unordered_map，map中的元素pair保存在vector<pair<int, int>>中就可以支持sort操作
        for (auto& temp : map)
            b.push_back(temp);      //map,unordered_map中的元素都是以pair类存在
        //sort(a.begin(), a.end());//map,unordered_map不支持sort算法
       // stable_sort(b.begin(), b.end(),greater<int>());
       //进行排序
        std::sort(b.begin(), b.end(),
            [=](std::pair<int, int>& a, std::pair<int, int>& b) { return a.second > b.second; });
        for (auto it = b.begin(); it != b.end(); ++it) {
            count++;
            if (count > k)
                break;
            vec.emplace_back(it->first);
        }
        return vec;
    }
};

时间复杂度：O（nlogn），主要为sort的排序时间
空间复杂度：O（n）

方法二：堆

首先遍历整个数组，并使用哈希表记录每个数字出现的次数，并形成一个「出现次数数组」。找出原数组的前 k 个高频元素，就相当于找出「出现次数数组」的前 k大的值。

最简单的做法是给「出现次数数组」排序。但由于可能有O(N) 个不同的出现次数（其中 N 为原数组长度），故总的算法复杂度会达到 )O(NlogN)，不满足题目的要求。

在这里，我们可以利用堆的思想：建立一个小顶堆，然后遍历「出现次数数组」：

如果堆的元素个数小于 k，就可以直接插入堆中。
如果堆的元素个数等于 k，则检查堆顶与当前出现次数的大小。如果堆顶更大，说明至少有 k 个数字的出现次数比当前值大，故舍弃当前值；否则，就弹出堆顶，并将当前值插入堆中。

遍历完成后，堆中的元素就代表了「出现次数数组」中前 k 大的值。

class Solution {
public:
    static bool cmp(pair<int, int>& m, pair<int, int>& n) {
        return m.second > n.second;
    }

    vector<int> topKFrequent(vector<int>& nums, int k) {
        unordered_map<int, int> occurrences;
        for (auto& v : nums) {
            occurrences[v]++;
        }

        // pair 的第一个元素代表数组的值，第二个元素代表了该值出现的次数
        priority_queue<pair<int, int>, vector<pair<int, int>>, decltype(&cmp)> q(cmp);//decltype 用于类型自动推断，传入&cmp函数指针
        for (auto& [num, count] : occurrences) {
            if (q.size() == k) {
                if (q.top().second < count) {
                    q.pop();
                    q.emplace(num, count);
                }
            } else {
                q.emplace(num, count);
            }
        }
        vector<int> ret;
        while (!q.empty()) {
            ret.emplace_back(q.top().first);
            q.pop();
        }
        return ret;
    }
};

时间复杂度：O（nlogk）
空间复杂度：O（n）

方法三：基于快速排序

我们可以使用基于快速排序的方法，求出「出现次数数组」的前 k 大的值。

在对数组arr[l…r] 做快速排序的过程中，我们首先将数组划分为两个部分 arr[i…q−1] 与 arr[q+1…j]，并使得arr[i…q−1] 中的每一个值都不超过 arr[q]，且arr[q+1…j] 中的每一个值都大于arr[q]。

于是，我们根据 k 与左侧子数组 arr[i…q−1] 的长度（为 q−i）的大小关系：

如果k≤q−i，则数组 arr[l…r] 前 k 大的值，就等于子数组 arr[i…q−1] 前 k 大的值。
否则，数组 arr[l…r] 前 k 大的值，就等于左侧子数组全部元素，加上右侧子数组arr[q+1…j] 中前k−(q−i) 大的值。

原版的快速排序算法的平均时间复杂度为 O(NlogN)。我们的算法中，每次只需在其中的一个分支递归即可，因此算法的平均时间复杂度降为O(N)。

class Solution {
public:
    void qsort(vector<pair<int, int>>& v, int start, int end, vector<int>& ret, int k) {
        int picked = rand() % (end - start + 1) + start;
        swap(v[picked], v[start]);

        int pivot = v[start].second;
        int index = start;
        for (int i = start + 1; i <= end; i++) {
            if (v[i].second >= pivot) {
                swap(v[index + 1], v[i]);
                index++;
            }
        }
        swap(v[start], v[index]);

        if (k <= index - start) {
            qsort(v, start, index - 1, ret, k);
        } else {
            for (int i = start; i <= index; i++) {
                ret.push_back(v[i].first);
            }
            if (k > index - start + 1) {
                qsort(v, index + 1, end, ret, k - (index - start + 1));
            }
        }
    }

    vector<int> topKFrequent(vector<int>& nums, int k) {
        unordered_map<int, int> occurrences;
        for (auto& v: nums) {
            occurrences[v]++;
        }

        vector<pair<int, int>> values;
        for (auto& kv: occurrences) {
            values.push_back(kv);
        }
        vector<int> ret;
        qsort(values, 0, values.size() - 1, ret, k);
        return ret;
    }
};

时间复杂度：O(N^2)，其中 N 为数组的长度。设处理长度为 N 的数组的时间复杂度为 f(N)。由于处理的过程包括一次遍历和一次子分支的递归，最好情况下，有 f(N)=O(N)+f(N/2)，根据主定理，能够得到 f(N) = O(N)。最坏情况下，每次取的中枢数组的元素都位于数组的两端，时间复杂度退化为 O(N^2)。但由于我们在每次递归的开始会先随机选取中枢元素，故出现最坏情况的概率很低。平均情况下，时间复杂度为O(N)。
空间复杂度：O(N)。哈希表的大小为 O(N)，用于排序的数组的大小也为 O(N)，快速排序的空间复杂度最好情况为 O(logN)，最坏情况为O(N)。

Emperorist

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
leetcode347-前k个高频元素

给你一个整数数组 nums 和一个整数 k ，请你返回其中出现频率前 k 高的元素。你可以按任意顺序返回答案。方法一：哈希表+排序将数组中每个元素出现的次数存入哈希表中，对哈希表进行排序，取前k个元素即为题目要求的前k个高频元素。class Solution {public: vector<int> topKFrequent(vector<int>& nums, int k) { int count=0; vector&l
复制链接

扫一扫