![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Massive Data Sets
sytu_hzj
爱足球、爱老婆,写程序是被逼的
展开
-
MapReduce论文中文版
原文地址:http://peopleyun.com/?p=890 摘要 MapReduce是一个编程模型,也是一个处理和生成超大数据集的算法模型的相关实现。用户首先创建一个Map函数处理一个基于 key/value pair的数据集合,输出中间的基于key/value pai转载 2011-10-08 22:01:00 · 1322 阅读 · 0 评论 -
10G整数文件需找中位数
题目:在一个文件中有 10G 个整数,乱序排列,要求找出中位数。内存限制为 2G。只写出思路即可(内存限制为 2G的意思就是,可以使用2G的空间来运行程序,而不考虑这台机器上的其他软件的占用内存)。 分析: 既然要找中位数,很简单就是排序的想法。那么基于字节的桶转载 2011-10-09 19:33:42 · 1649 阅读 · 0 评论 -
桶排序
转自http://hxraid.iteye.com/blog/647759 从《基于比较的排序结构总结 》中我们知道:全依赖“比较”操作的排序算法时间复杂度的一个下界O(N*logN)。但确实存在更快的算法。这些算法并不是不用“比较”操作,也不是想办法将比较操作的次数减少到 l转载 2011-10-09 19:40:55 · 594 阅读 · 0 评论