面试题:在一个文件中有 10G 个整数,乱序排列,要求找出中位数(内存限制为2G)...

假设整数为32bit,4个字节存储

这种题目,首先想到的是分而治之。将文件中数字分组。然后遍历文件中的数字,按分组进行计数。最后找到中位数所在的分组区间

1、如果10G个整数都为同一个,那么10G整数会分布在一个区间,10G=5*2^31 > 2^31 - 1,所以每个分组存储计数的整数用64bit存储。

2、那么2G内存能够存储多少个64bit整数范围呢?2*2^30/8 = 256M 个范围区间。

3、那么每个区间的存储整数的范围长度是多少? 2^32 /256M = 16 

4、所以整数区间段为: 0~15, 16~31, 。。。

5、然后遍历10G个整数的文件,在对应整数区间内计数。

6、找到存在中位数的区间段,并记录这个区间段之前的计数m.

7、重新遍历整数文件,找到m+a0+a1+...an = 5G 中的an,即为中位数

 

转载于:https://www.cnblogs.com/yiyezhou/p/11015411.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值