希望通过学习hadoop源码,深刻理解分布式系统设计原理。
hadoop源码学习思路:首先了解各个功能模块,然后选择一个 自己感兴趣的模块开始阅读。
分布式计算(map reduce),存储(hdfs),资源管理(yarn)
整体学习思路其实分为三个阶段:
- 应用层面,首先用熟hadoop
- 阅读源码层面,这个是重头戏,选择一个自己感兴趣的模块开始模块,一般来讲client模块比较简单,可以先看 client模块
修改源码层面,这就是后面的事了。。
在开始第二阶段之前还是先来了解一下各个hadoop package