https://leetcode-cn.com/problems/kth-largest-element-in-an-array/
在未排序的数组中找到第 k 个最大的元素。请注意,你需要找的是数组排序后的第 k 个最大的元素,而不是第 k 个不同的元素。
示例 1:
输入: [3,2,1,5,6,4] 和 k = 2
输出: 5
示例 2:
输入: [3,2,3,1,2,4,5,5,6] 和 k = 4
输出: 4
说明: 你可以假设 k 总是有效的,且 1 ≤ k ≤ 数组的长度。
思路
思路1,构建优先队列(小顶堆)。先将数组添加到k-1个。接着继续添加时,判断,如果新值比堆顶大,就弹出堆顶,放入新元素。扫描到最后时,堆顶就是第k大的元素。
思路2,排序并返回第k大。
思路3,partition。
答案
class Solution {
public:
int findKthLargest(vector<int>& nums, int k) {
priority_queue<int,vector<int>,greater<int>> q;
for (int i = 0; i < nums.size(); i++) {
if (q.size() < k) //构建大小为k的小顶堆
q.push(nums[i]);
else if (nums[i] > q.top()) {
q.pop();
q.push(nums[i]);
}
}
return q.top();
}
};
topK问题
本部分题目常常是1亿数据中,找出最大的前多少个。本题用堆的思路非常适合。可以将无法装入内存中的数据分开,建立堆,再进行扫描。当然也有一些其他方法。
- 最直观的思路:全排序,这几乎不可能。
- 如果这1亿个书里面有很多重复的数,先通过Hash法,把这1亿个数字去重复,这样如果重复率很高的话,会减少很大的内存用量,从而缩小运算空间,然后通过分治法或最小堆法查找最大的10000个数。
去重
海量数据中去除相同的重复元素也经常考。一般使用位图法。
举个简单例子,在java中一个int类型的数有32位,而这32只表示一个数太过浪费,于是就考虑让这32位可以表示32个数,每一位表示该数是否存在,例如:
这里用16位的二进制就能表示十六个数字,1表示存在,0表示不存在,上图就表示存在(16,12,6,4,1)这五个数。上图16bit可以表示1~16是否存在。而假设题目徐兆8位重复电话号码,有:
8位整数可以表示的最大十进制数值为99999999,如果每个数字对应于位图中的一个bit位,那么存储八位整数需要99999999bit大约99Mbit,因为1Byte=8bit,所以99Mbit折合成内存为99/8=12.375MB的内存,及可以只用12.375MB的内存表示所有的8位数电话号码的内容。