题目大意是:有很多很多数(5000w-6000w个数),从中取出最小的前100个数
这个题目本身没什么难度,但面试时面试官先跟你扯些排序等其他的东西后,就会打乱自己的思维。我当时就陷入怎么排序和怎么存储中,最后这个题目答错了!!!
其实上根本没必要管这些数据时从哪里来的,需要存到哪,我们只需要找到最小的前100个数就行了。原理很简单,就像找到最小的数,然后在找第二小的数....这样做显然是没有效率的。换个思路,我们可以采用一个有100个元素的数组来做到一次遍历数据就找出最小的前100个数。可以把前100个数按照二分插入的方法放入数组中,然后遍历之后的所以元素,如果比数组中最后一个数大或相等则忽略,继续遍历下一个数;如果比数组中的最后一个数小,则需要替换最后一个数,再采用二分插入的方法放入数组中。
这里用c++写一段模拟code:(假设有20个数据,取出其中最小的10个)
#include <iostream>
#include <vector>
#include <algorithm>
static const int kNumFetch = 10;
int main(void)
{
int ary[20] = {23, 2, 45, 4, 76, 87, 12, 34, 62, 28, 92, 8, 24, 20, 9, 1, 24, 18, 87, 3