经典笔试题:从十亿个整数中选择前100大整数的算法实现

转自:http://www.cnblogs.com/kanong/archive/2010/10/06/1844490.html

 

最近几天都在研究一些面试,笔试题,发现有一种题型很经常出现,如从十亿个整数中选择前100大整数,或者是这类题的变形:

很多人看到这种题的第一反应是排序,如果你是这样回答的话,offer肯定是没有了。原因如下:

1.  存放10亿个数据的内存得多大呀, 所以内部排序是不可能了!

2.  就算采用外部排序的方法,可以解决内存不足的问题,但外部排序读取内存非常频繁,将大大影响速度,我怀疑计算机在报废之前,拍完序的可能性!

好了,说说我的方案吧!是我目前能想到的最好的方法,如果谁有更好的,欢迎分享呀!

1.  用10亿个数据的前100个整数建立小顶堆。

2.  向堆中插入数据,如果比堆顶小的话,直接抛弃。否则替换堆顶,进行堆调整。

3.  当上面的操作完成后,堆里面的数据就是前100大的整数了。

上面的方法,读取文件的次数为10亿次(这是不可避免的),使用的内存为100个整数空间,最坏情况下的时间复杂度为(10亿*log(100)).

代码如下:<BR>

 

 

 

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
1. 给定一个含有 n 个整数的数组,判断该数组是否为某个连续子数组的平方和序列。如果是,返回连续子数组的左右下标,否则返回 [-1,-1]。 例如,对于数组 [1,4,9,16,25,36,49],返回 [0, 2],因为该数组为 [1,4,9] 的平方和序列。 A. 暴力枚举,时间复杂度 O(n^3) B. 双指针,时间复杂度 O(n) C. 动态规划,时间复杂度 O(n^2) D. 二分查找,时间复杂度 O(nlogn) 答案:B 2. 给定一个无序数组 nums,其的数字可能为正、负或零。找到一个具有最大和的连续子数组(至少包含一个数字)。 例如,对于数组 [-2,1,-3,4,-1,2,1,-5,4],最大子数组为 [4,-1,2,1],其和为 6。 A. 递归分治,时间复杂度 O(nlogn) B. 贪心算法,时间复杂度 O(n) C. 动态规划,时间复杂度 O(n) D. 暴力枚举,时间复杂度 O(n^2) 答案:C 3. 给定一个由 n 个整数组成的非空数组,其每个元素都是在 1 到 n 之间的整数。找出数组重复出现的元素,以及只出现一次的元素。 例如,对于数组 [4,3,2,7,8,2,3,1],重复出现的元素为 [2,3],只出现一次的元素为 [4,7,8,1]。 A. 桶排序,时间复杂度 O(n) B. 哈希表,时间复杂度 O(n) C. 二分查找,时间复杂度 O(nlogn) D. 堆排序,时间复杂度 O(nlogn) 答案:B 4. 给定一个二叉树,找到其最大深度。最大深度定义为从根节点到最远叶子节点的最长路径上的节点数。 例如,对于下面这个二叉树,最大深度为 3。 ``` 3 / \ 9 20 / \ 15 7 ``` A. 广度优先搜索,时间复杂度 O(n) B. 深度优先搜索,时间复杂度 O(n) C. 递归实现,时间复杂度 O(n) D. 分治算法,时间复杂度 O(nlogn) 答案:C 5. 给定一个正整数 n,生成一个由 1 到 n^2 的整数组成的螺旋矩阵。矩阵数字的顺序应该是从左上角开始沿顺时针方向依次递增,最后到达右下角。 例如,当 n = 3 时,生成的矩阵为: ``` 1 2 3 8 9 4 7 6 5 ``` A. 暴力枚举,时间复杂度 O(n^2) B. 递归分治,时间复杂度 O(nlogn) C. 链表模拟,时间复杂度 O(n^2) D. 常规模拟,时间复杂度 O(n^2) 答案:D

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值