接触Hadoop将近8个月了,从最初的懵懂,到熟练配置Hadoop环境、基于该环境下的Map/Reduce编程、以及Hadoop源码的研读,这一路走来都离不开网上一些无私奉献的同道中人及优秀的论坛,包括:淘宝的官方博客(http://www.tbdata.org/archives/category/cloud-computing/hadoop)、CSDN非常优秀的Hadoop源码分析博客(http://blog.csdn.net/shirdrn/archive/2009/09/28/4608377.aspx)、ITCYC非常优秀的Hadoop源码分析博客(http://caibinbupt.iteye.com/blog/282735)、cloudera developer center(http://events.sfgate.com/redwood-city-ca/events/show/184284586-cloudera-administrator-training-for-apache-hadoop)、Apache Hadoop的maillist等等。
自从Hadoop从0.20.2到0.21过渡后,其内部的代码结构也发生了变化。Hadoop0.20.2的源码是主要是集中在文件夹"src/core"里,Hadoop