Problem
输入n个整数,找出最小的前k个数字(或者第K大的数字),例如输入4,5,1,6,2,7,3,8这八个数,则输出最小4个数是1,2,3,4.
Solution A
O(n)解法,需要修改输入数组。
可以采用快速排序Partition函数来解决这个问题。快排的Partition函数所完成的功能是将小于pivot的数放在Partiton函数返回值的左边,大于pivot的数放在Partiton函数的右边,一趟划分的时间复杂度是O(n).因此我们可以基于Partition函数的这种功能,判断每次返回值与k的大小来调整Partition的位置。
Source code A 时间复杂度低
#include <iostream>
using namespace std;
void exchange(int &a, int &b)
{
int temp = b;
b = a;
a = temp;
}
int partition(int* num, int start, int end)
{
int pivot = num[end];
int i = start - 1;
for (int j = start; j <= end - 1; j++)
{
if (num[j] < pivot)
exchange(num[++i], num[j]);
}
exchange(num[++i], num[end]);
return i;
}
int main()
{
int num[100];
int count = 0, k = 0;
cout << "Please cin Total count and k-th number\n";
cin >> count >> k;
for (int i = 0; i < count; i++)
cin >> num[i];
int index = partition(num, 0, count - 1);
int start = 0, end = 0;
while (index != k - 1)
{
if (index < k - 1)
{
start = index + 1;
index = partition(num, start, end);
}
else
{
end = index - 1;
index = partition(num, start, end);
}
}
for (int i = 0; i < k; i++)
cout << num[i] << " ";
}
Solution B 适合海量数据
O(nlgk),适合大数据存储,不需要修改输入数据。
维护一个大小为k的容器来存储目前已知的最小K个数,每次从数据中读入一个数,如果容器内个数小于k,则直接插入。若容器内个数大于k,则将容器内最大的数与当前数比较,若最大数大于当前数,则将最大数从容器中删除,将当前数插入容器;否则丢弃当前数。
因为容器需要每次返回一个最大值,所以自然想到用STL的priority_queue来是实现当前容器,每次可以在O(1)的时间获得最大值,但需要O(lgk)的时间来完成插入和删除操作。