基本信息
原书名: Hadoop: The Definitive Guide,Second Editon
原出版社: O'Reilly Media
作者: (美)Tom White [作译者介绍]
译者: 周敏奇 钱卫宁 金澈清 王晓玲
丛书名: 清华大学出版社O'Reilly系列
出版社:清华大学出版社
ISBN:9787302257585
上架时间:2011-7-4
出版日期:2011 年7月
开本:16开
页码:600
版次:2-1
内容介绍:
《Hadoop权威指南(第2版)》从Hadoop的缘起开始,由浅入深,结合理论和实践,全方位地介绍Hadoop这一高性能处理海量数据集的理想工具。全书共16章,3个附录,涉及的主题包括:haddoop简介;mapreduce简介;Hadoop分布式文件系统;Hadoop的i/o、mapreduce应用程序开发;mapreduce的工作机制;mapreduce的类型和格式;mapreduce的特性;如何构建Hadoop集群,如何管理Hadoop;pig简介;hbase简介;hive简介;zookeeper简介;开源工具sqoop,最后还提供了丰富的案例分析。
《Hadoop权威指南(第2版)》是Hadoop权威参考,程序员可从中探索如何分析海量数据集,管理员可以从中了解如何安装与运行Hadoop集群。
google帝国的基石是什么?mapreduce算法!开源项目Hadoop作为它的一个具体实现,可以轻松用于构建和维护一个可靠性高、伸缩性强的分布式系统。
作者tomwhite作为Hadoop的项目负责人,通过自己对Hadoop和Hadoop社区的理解,化繁为简,用浅显易懂的语言介绍了Hadoop能做什么,怎么做才能充分发挥Hadoop的优势,Hadoop能够和哪些开源工具结合使用。这是一本主题丰富、讲解透彻的权威参考书,可帮助程序员了解分析海量数据集的细枝末节,帮助管理员掌握搭建和运行Hadoop集群的具体过程。
经过修订和更新的第2版概述了Hadoop的最新动态,例如hive、sqoop和avro等。书中还提供了案例分析来帮助读者了解如何用Hadoop来解决具体的问题。如果想充分利用数据,从中挖掘出有价值的见解或者观点,毫无疑问,这本书将是您不可或缺的重要参考。
使用Hadoop分布式文件系统(hdfs)来存储大型数据集,然后用mapreduce对这些数据集执行分布式计算
Hadoop的数据和i/o构建块(用子压缩、数据完整性、序列化和持久处理)
探究mapreducc应用开发中常见的陷阱和高级特性
设计,构建和管理门adoop专用集群或在云上运行Hadoop
使用pig这种高级的查询语言来进行大规模数据处理
使用hive(Hadoop的数据仓库系统)来分析数据集
使用hbase(Hadoop的数据库)来处理结构化数据和半结构化数据
深入介绍zookeeper,一个用子构建分布式系统的协作类型工具箱
Hadoop权威指南(中文第2版)PDF版下载
免费下载地址在 http://linux.linuxidc.com/
用户名与密码都是www.linuxidc.com
具体下载目录在 /2012年资料/7月/21日/Hadoop权威指南(中文第2版)PDF/