【Hadoop书籍】
这些书均可以从http://ishare.iask.sina.com.cn/上下载电子版,有些书籍是作者主动开源的,另外一些是不劳而获者上传的,可用于学习,但不要盗印。
(0)Hadoop技术内幕:深入解析YARN架构设计与实现原理
从原理和源代码角度深入剖析Hadoop YARN(Hadoop 2.0新增的系统)内部设计原理,该书具体介绍参考:http://hadoop123.com/。
(1)Hadoop技术内幕:深入解析MapReduce架构设计与实现原理
从源代码角度深入剖析Hadoop MapReduce内部设计原理,该书具体介绍参考:http://hadoop123.com/,该书的亚马逊购买网址是http://t.cn/zT8FxJH。该书的姊妹篇是《Hadoop技术内幕:深入解析Hadoop Common和HDFS架构设计与实现原理》,同样可在亚马逊等网站上购买,链接是:亚马逊购买链接。
(2) Hadoop: The Definitive Guide
http://book.douban.com/subject/3220004/
Hadoop权威指南,涉及知识面非常全面的一本书,介绍了Hadoop生态系统中的各个软件,包括HDFS,MapReduce,Hive,Hbase等。截至2013年1月,该书已经出了第三版,在该版本中,添加了少量的YARN相关内容。
(3)Hadoop Operations
http://book.douban.com/subject/17458570/
这是一本Hadoop运维方面的书籍,由Cloudera员工操手,介绍了Hadoop集群从硬件选型到软件配置等方面需考虑的因素,这本书不仅介绍了Hadoop 1.0的安装和部署方法,也介绍而来最新的YARN和HDFS Federation的部署方法。个人认为,这本书是运维人员必看的书籍。
(4) Hadoop in Action
http://book.douban.com/subject/4049942/
该书属于MapReduce应用程序开发类书籍,它介绍了几种MapReduce应用程序开发方法,包括Java、Hadoop Streaming和Hadoop pipes,此外,还介绍了面向SQL和脚本语言的Hive和Pig。
(5)Pro Hadoop
http://book.douban.com/subject/3529886/
该书与Hadoop In Action类似,但涉及内容更全面,更详细,它不仅介绍了MapReduce应用程序开发方法,还给出了各种应用实例,详细介绍了各种调试方法,HDFS使用和运维等知识等。
(6)Hadoop in Practice
http://book.douban.com/subject/10748575/
该书籍是一线工程师编写的,出发点与以上几本书不同,它重在解决更加实际的问题,比如如何将数据移入或者移出HDFS,如果利用MapReduce思想解决各种问题等。
(7)MapReduce Design Patterns
http://book.douban.com/subject/11229683/
MapReduce设计模式,将MapReduce运算符抽象成设计模式,以便能够重用。
如果你想更准确地学习Hadoop知识,请一定要阅读英文原著,国内翻译的Hadoop图书是一塌糊涂。另外,国内也有人写了一些Hadoop书籍,比如《实战Hadoop:开启通向云计算的捷径》,《高可用性的HDFS:Hadoop分布式文件系统深度实践(配光盘)》,《Hadoop实战》等,这些书均可以在京东、当当、亚马逊等网站上买到,有兴趣的读者可以阅读一下。
【Hadoop网络资源】
(1)Cloudera Blog:http://blog.cloudera.com/
(2)Hortonworks Blog:http://hortonworks.com/blog/
(3)Apache Hadoop:http://hadoop.apache.org/
(4)Hadoop jira:https://issues.apache.org/jira/browse/YARN
https://issues.apache.org/jira/browse/HADOOP
https://issues.apache.org/jira/browse/HDFS
https://issues.apache.org/jira/browse/MAPREDUCE
(5) Hadoop wiki:http://wiki.apache.org/hadoop/
原创文章,转载请注明: 转载自董的博客