剑指offer40. 最小的k个数 P209
题目:输入n个整数,找出其中最小的k个数。例如输入4、5、1、6、2、7、3、8这8个数字,则最小的4个数字是1、2、3、4。
方法一:类似于上一题39, 同样基于Partition函数对数组进行划分,基于第k个元素调整,使得第k个索引之前的都比num[k]小, k之后的都比nums[k]大。左边的k个数字就是最小的k个数字,但是这些数字可能无序。
vector<int> findCore(int *nums,int len) { // 主调函数
vector<int> v; // 返回list
if (!isValid(nums, len)) return v;
int mid = len >> 1; // 中位数索引
int start = 0;
int end = len - 1;
int index = Partition(nums, start, end); // 第一次划分
while (index != k - 1) { // 出口
if (index > k - 1)
end = index - 1;
else
start = index + 1;
index = Partition(nums, start, end);
}
for (int i = 0; i < k; ++i)
v.push_back(nums[i]);
}
时间复杂度是 O(n), 不适合海量数据(快排必须一次性读入内存)而且会污染数组。
方法2: 最大堆
本方法使用于海量数据处理。大致思想是建一个K个数的大堆,每次拿一个数和堆顶元素比较,如果这个数比堆顶元素大,则必然不是最小的K个数,如果这个数比堆顶元素小,则与堆顶元素交换,然后在向下调整一次建成新的大堆,然后遍历所有的数,直到最小的K个数都进堆里。
这样既可以保证堆中是存的目前的最小的k个数,还不用一次性把所有数据读入内存,每次只从磁盘取一个和堆顶比较即可。时间复杂度O(nlogk), 但是非常适用海量数据
最大的k个数:建最小堆, 最小的K个数:建最大堆
举例:leetcode215:求第K大的数(跟本题求解刚好相反) !!!
int findKthLargest(vector<int>& nums, int k) {
priority_queue<int ,vector<int>,greater<int>> pq; // 最小堆
for (int i = 0; i < nums.size(); ++i) {
if (pq.size() < k) pq.push(nums[i]); // 控制堆的大小
else if (nums[i] >= pq.top()) { // 大于堆顶,弹出堆顶后压入
pq.pop();
pq.push(nums[i]);
}
}
return pq.top();
}