【题目】
输入n个整数,找出其中最小的K个数。例如输入4,5,1,6,2,7,3,8这8个数字,则最小的4个数字是1,2,3,4,。
【思路】
最简单暴力的方法就是先用sort排序,然后在遍历输出最小的K个数。复杂度为 O ( n l o g n ) O(nlog{n}) O(nlogn) 。
还有一种更快,时间复杂度为 O ( n l o g k ) O(nlog{k}) O(nlogk)的方法:
我们可以先创建一个大小为k的数据容器来存储最小的k个数字,接下来我们每次从输入的n个整数中的n个整数中读入一个数。如果容器中已有的数字少于k个,则直接把这次读入的整数放入容器之中;如果容器已经有k个数字了,也就是容器满了,此时我们不能再插入新的数字而只能替换已有的数字。找出这已有的k个数中的最大值,然后拿这次待插入的整数和最大值进行比较。如果待插入的值比当前已有的最大值小,则用这个数替换当前已有的最大值;如果待插入的值比当前已有的最大值还要大,那么这个数不可能是最小的k个整数之一,于是我们可以抛弃这个整数。
因此当容器满了之后,我们要做3件事情:一是在k个整数中找到最大数;二是有可能在这个容器中删除最大数;三是有可能要插入一个新的数字。如果用一个二叉树来实现这个数据容器,那么我们在O(logk)时间内实现这三步操作。因此对于n个输入数字而言,总的时间效率就是O(nlogk)。
优点:1)没有修改输入的数据。2)适合海量数据的输入,对于数据量巨大到无法一次性读取到内存的数据,采用这种方法,每次从硬盘读取一个数字进行操作就行。
【代码】
class Solution {
public:
vector<int> GetLeastNumbers_Solution(vector<int> input, int k) {
int length = input.size();
vector<int> result;
if (length <= 0 || k <= 0 || k > length) {
return result;
}
for (int i = 0; i < length; i++) {
if (result.size() < k) {
result.push_back(input[i]);
}
else {
// 建初堆(大根堆)
for (int j = k / 2; j >= 0; j--) {
HeapAdjust(result, j, k);
}
//堆排序
for (int j = k - 1; j > 0; j--) {
swap(result[0], result[j]);
HeapAdjust(result, 0, j);
}
if (input[i] < result[k - 1]) {
result[k - 1] = input[i];
}
}
}
return result;
}
private:
void HeapAdjust(vector<int> &input, int point, int length) {
int temp = input[point];
for (int i = 2 * point + 1; i < length; i = 2 * i + 1) {
if (i + 1 < length && input[i] < input[i + 1]) {
i++;
}
if (temp >= input[i]) {
break;
}
input[point] = input[i];
point = i;
}
input[point] = temp;
}
};