初衷
目前的工作就是维护着一个hadoop搭建的数据集市,既是工作的需要,同时想研究下Hadoop底层代码原理,主要依据这篇博文(http://caibinbupt.iteye.com/blog/262412)的线索看下去,如果中途有自己感兴趣的就先散开看看.
原则以看代码为主,看别人的文章为辅,但是也不会很仔细的阅读每行代码,知道那些代码能干些什么事,以后遇到问题回来仔细查看,同时将自己看到过的资料记录下来,基本不会自己总结写,(呵呵比较浪费时间,不过参考的文档都给出url自己)
阅读代码版本基于hadoop-0.20.2-cdh3u0
源码包下载
http://www.apache.org/dyn/closer.cgi/hadoop/common/
api文档
http://hadoop.apache.org/common/docs/r0.20.2/api/index.html
入门文档
http://hadoop.apache.org/common/docs/r0.20.2/index.html
中文老版文档
http://hadoop.apache.org/common/docs/r0.20.2/cn/index.html
源码分析url
http://caibinbupt.iteye.com/blog/262412
http://blog.csdn.net/heyutao007/article/details/5725379#
http://hi.chinaunix.net/?uid-9976001-action-viewspace-itemid-45102
https://ccp.cloudera.com/display/SUPPORT/Learn+Hadoop
入门文档
http://wiki.lustre.org/images/1/1b/Hadoop_wp_v0.4.2.pdf