1. 问题描述:
给你一个整数数组 nums 和一个整数 k ,请你返回其中出现频率前 k 高的元素。你可以按任意顺序返回答案。
示例 1:
输入: nums = [1,1,1,2,2,3], k = 2
输出: [1,2]
示例 2:
输入: nums = [1], k = 1
输出: [1]
提示:
1 <= nums.length <= 10 ^ 5
k 的取值范围是 [1, 数组中不相同的元素的个数]
题目数据保证答案唯一,换句话说,数组中前 k 个高频元素的集合是唯一的
来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/top-k-frequent-elements
2. 思路分析:
① 分析题目可以知道最简单的处理方法是对nums数组中元素出现的次数进行计数,可以使用哈希表统计数字出现的次数,因为使用的python语言所以可以使用字典对出现的元素进行计数,然后对字典按照值(也即元素出现的次数)由大到小进行排序,对字典进行排序之后得到的是键值对对应的元组组成的列表,我们遍历列表将前k个元素加入到结果集即可。
② 除了①中的方法我们还可以对代码进行优化,这里就需要使用到计数排序的思想,需要声明一个列表来记录字典中元素出现次数的个数,因为每个元素最少出现一次,所以需要声明长度为n的列表s来记录字典中元素出现的次数,首先与①中的方法类似我们还是使用字典对nums数组中出现的元素进行计数,然后遍历字典,将字典中元素出现的次数填入到列表s中,列表s的下标表示元素出现的次数,值表示出现当前次数对应的元素个数,我们可以遍历列表s找到前k个高频元素的分界点,也即在列表s从后往前遍历找到前k个高频元素出现次数的分界点i,最后我们遍历一下字典找出出现次数大于i的元素,这些元素就是前k个高频元素。
3. 代码如下:
字典:
from typing import List
import collections
class Solution:
# 字典计数
def topKFrequent(self, nums: List[int], k: int) -> List[int]:
dic = collections.defaultdict(int)
for n in nums:
dic[n] += 1
dic = sorted(dic.items(), key=lambda x: x[1], reverse=True)
res = list()
for i in range(k):
res.append(dic[i][0])
return res
计数排序思想:
from typing import List
import collections
class Solution:
def topKFrequent(self, nums: List[int], k: int) -> List[int]:
dic = collections.defaultdict(int)
for x in nums:
dic[x] += 1
n = len(nums)
s = [0] * (n + 1)
# 计算个个元素出现的次数
for key, value in dic.items():
s[value] += 1
t = 0
i = n
# 找到前k个高频元素的分界点, 分界点即为元素出现的次数
while i >= 0 and t < k:
# 累加出现次数较高的的个数
t += s[i]
i -= 1
res = list()
for key, value in dic.items():
if value > i: res.append(key)
return res