Hadoop集群系列7:WordCount运行详解
本文为Hadoop集群系列第七篇,单词计数是最简单也是最能体现MapReduce思想的程序之一,可以称为MapReduce版"Hello World"。
1、MapReduce理论简介
1.1 MapReduce编程模型
MapReduce采用"分而治之"的思想,把对大规模数据集的操作,分发给一个主节点管理下的各个分节点共同完成,然后通过整合各个节点的中间结果,得到最终结果。
转载
2013-11-02 17:11:48 ·
628 阅读 ·
0 评论