算法
iteye_6808
这个作者很懒,什么都没留下…
展开
-
(转)海量数据处理专题
1. 给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url?方案1:可以估计每个文件安的大小为50G×64=320G,远远大于内存限制的4G。所以不可能将其完全加载到内存中处理。考虑采取分而治之的方法。s 遍历文件a,对每个url求取,然后根据所取得的值将url分别存储到1000个小文件(记为)中。这样每个小文件的大约...原创 2011-09-21 17:42:13 · 94 阅读 · 0 评论 -
bitmap与位排序法
编程珠玑下载:http://ishare.iask.sina.com.cn/f/10532519.html?from=isnom编程珠玑--位图法排序位图法是《编程珠玑》第一章中出现的磁盘排序算法。 题目:一个最多包含n个正整数的文件,每个数都小于n,其中n=10^7,且所有正整数都不重复。求如何将这n个正整数升序排列。约束:最多有1MB的内存空间可用,...原创 2011-09-22 00:36:08 · 137 阅读 · 0 评论