题目描述
给你一个整数数组 nums
和一个整数 k
,请你返回其中出现频率前 k
高的元素。你可以按 任意顺序 返回答案。
示例 :
输入: nums = [1,1,1,2,2,3], k = 2 输出: [1,2]
思路
我们可以先用哈希表统计出不同元素的频率,然后找出频率在前K名的元素,这其实就演化成TopK问题了。
什么TopK问题呢?
即求数据集合中前K个最大的元素或最小的元素,而这种问题的数据量在一般情况下都比较大。
在生活中我们随处可见,比如:学校前10名,世界500强、外卖评分榜前10名、游戏前100等等。
求解TopK问题,我们能想到的最直接的方式就是排序,但是,如果数据量非常大,排序就不太可取了因为数据很可能不能一下子全部加载到内存当中,也就是说,内存装不了这么大的数据,最佳的办法就是用堆来解决。
什么是堆呢?
堆是一棵完全二叉树,树中每个结点的值都不小于(或不大于)其左右孩子的值。 如果父亲结点是大于等于左右孩子就是大顶堆,小于等于左右孩子就是小顶堆。
大多数语言都封装了这种数据结构,一般称之为优先级队列。从小到大排列就是小顶堆,从大到小排就是大顶堆。
那这道题我们应该使用大顶堆还是小顶堆呢?如果使用大顶堆的话,当堆内元素的数量超过K个的时候,我们再插入数据,我们只能把堆内最大的元素给踢出了,这显然达不到我们的目的,所以我们应该使用小顶堆。
解法
C++版本
Java版本