![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Hadoop In Action
xxing22657
这个作者很懒,什么都没留下…
展开
-
Hadoop In Action 第四章(1)
第四章 编写基本的MapReduce程序 本章涵盖了: 用Hadoop处理数据集,以专利数据为例 一个MapReduce程序的基本结构 基本的MapReduce程序,以数据统计为例 Hadoop的流API,用于使用脚本语言来编写MapReduce程序 使用Combiner来提升性能 MapReduce程序与您所学过的编程模型有所不同。您需要花一些时间,并进行一些练...2011-01-30 22:50:51 · 156 阅读 · 0 评论 -
Hadoop In Action 第四章(2)
第四章 编写基本的MapReduce程序 4.3 数量统计 许多外行人认为统计学就是数量统计,并且许多基本的Hadoop Job就是用于统计数量的。我们已经在第一章中看过统计单词个数的例子了。对于那些专利引用数据,我们可能想要知道专利被引用的次数。这也是一种数量统计。我们期望得到如下形式的结果: 1 210000 1100000 11000006 11...2011-02-01 16:26:41 · 91 阅读 · 0 评论