《Hadoop技术内幕:深入解析MapReduce架构设计与实现原理》(作者博客:http://dongxicheng.org/)和《Hadoop技术内幕:深入解析Hadoop Common和HDFS架构设计与实现原理》,
两本书蛮好的。还没细看。
可以看作者的博客学习。
新书《深入解析MapReduce架构设计与实现原理》
《Hadoop技术内幕:深入解析MapReduce架构设计与实现原理》(购书链接地址: 当当购书网址,京东购书网址,卓越购书网址,电子版下载地址:百度云盘下载地址,新浪微盘下载地址)是一本深入剖析Hadoop MapReduce内部实现原理的 书籍,该书内容基于Hadoop 1.x版本,通过原理介绍与源代码分析相结合的方法解析Hadoop MapReduce计算框架。
该书包含以下内容:
- JobTracker与TaskTracker内部实现
- Hadoop调度器(FIFO、Capacity Scheduler和FairScheduler)内部实现
- 数据计算引擎(Map Task、Reduce Task)内部实现
- Hadoop内部调优
- 下一代MapReduce(YARN/Corona/Mesos)原理和架构
这本书中涉及的下一代MapReduce(YARN/MRv2)内容比较少,如果你感兴趣,可暂时通过阅读作者的博客学习YARN(Yet Another Resource Negotiator,俗称“下一代MapReduce”),链接是 董的博客
该书不会涉及(有些可能会简单提及)以下内容:
- MapReduce程序设计方法与实例。(可阅读已出版书籍《Hadoop实战》)
- HDFS相关基础知识。(可阅读已出版书籍《Hadoop权威指南》)
- 非MapReduce系统介绍,比如HBase、Hive、Pig等。 (可阅读已出版书籍《Hadoop权威指南》)
- Hadoop部署、运维相关知识。(可阅读已出版书籍《Hadoop Operations》)
需要说明的是,该书也适合Hadoop应用程序开发工程师,毕竟,只有了解Hadoop内部原理,才能写出更高效的分布式程序,才能对作业进行评估和未知行为的预测,避免编写低效且具有破坏性的应用程序。
如果你是Hadoop应用程序开发、Hadoop内核研究、Hadoop二次开发、大数据方向研究生等相关人士,《Hadoop技术内幕:深入解析MapReduce架构设计与实现原理》和《深入解析Hadoop Common和HDFS架构设计与实现原理》两本新书,则是必读书籍,这两本书相对独立,可根据你的需要选择一本或者两本阅读。