Hadoop原来是Apache Lucene下的一个子项目,它最初是从Nutch项目中分离出来的专门负责分布式存储以及分布式运算的项目。简单地说来,Hadoop是一个可以更容易开发和运行处理大规模数据的软件平台。本文先从源码角度剖析MapReduce框架及运行原理。
1, Annotated Hadoop: 第一节 Hadoop是什么
2, Annotated Hadoop: 第二节 MapReduce框架结构
3, Annotated Hadoop: 第三节 MapReduce工作原理
未完待续
Annotated Hadoop 作者:naven 日期:
2007-12-29