书籍简介
全书5部分24章,第Ⅰ部分介绍Hadoop基础知识,主题涉及Hadoop、MapReduce、Hadoop分布式文件系统、YARN、Hadoop的I/O操作。第Ⅱ部分介绍MapReduce,主题包括MapReduce应用开发;MapReduce的工作机制、MapReduce的类型与格式、MapReduce的特性。第Ⅲ部分介绍Hadoop的运维,主题涉及构建Hadoop集群、管理Hadoop。第Ⅳ部分介绍Hadoop相关开源项目,主题涉及Avro、Parquet、Flume、Sqoop、Pig、Hive、Crunch、Spark、HBase、ZooKeeper。第Ⅴ部分提供了三个案例,分别来自医疗卫生信息技术服务商塞纳(Cerner)、微软的人工智能项目ADAM(一种大规模分布式深度学习框架)和开源项目Cascading(一个新的针对MapReduce的数据处理API)。
本书是一本权威、全面的Hadoop参考书和工具书,阐述了Hadoop生态圈的最新发展和应用,程序员可以从中探索海量数据集的存储和分析,管理员可以从中了解Hadoop集群的安装和运维。
下载地址
[下载链接]:
https://pan.baidu.com/s/1ZNIG74mqyIe5cS9qleBtPg
[提取码]:0812
提示:
若链接失效,请在对应文章下方进行留言提醒,小编会在第一时间进行更新书籍截图
备用下载链接:
https://pan.baidu.com/s/13yH_8JmDnJmg6jKiVOtaYQ
提取码:0812
希望做一个:程序猿专属的公众号
▲长按图片,扫描关注码客资源网