hadoop实战手册为3个部分,深入浅出地介绍了Hadoop 框架、编写和运行Hadoop 数据处理程序所需的实践技能及Hadoop之外更大的生态系统。本书适合需要处理大量离线数据的云计算程序员、架构师和项目经理阅读参考。
hadoop实战手册目录
第1章 Hadoop简介
1.1 为什么写《Hadoop 实战》
1.2 什么是Hadoop
1.3 了解分布式系统和Hadoop
1.4 比较SQL 数据库和Hadoop
1.5 理解MapReduce
1.5.1 动手扩展一个简单程序
1.5.2 相同程序在MapReduce中的扩展
1.6 用Hadoop统计单词——运行第一个程序
1.7 Hadoop历史
1.8 小结
1.9 资源
第2章 初识Hadoop
2.1 Hadoop 的构造模块
2.1.1 NameNode
2.1.2 DataNode
2.1.3 Secondary NameNode
2.1.4 JobTracker
2.1.5 TaskTracker
2.2 为Hadoop 集群安装SSH
2.2.1 定义一个公共账号
2.2.2 验证SSH安装
2.2.3 生成SSH密钥对
2.2.4 将公钥分布并登录验证
2.3 运行Hadoop
2.3.1 本地(单机)模式
2.3.2 伪分布模式
2.3.3 全分布模式
2.4 基于Web 的集群用户界面
2.5 小结
第3章 Hadoop组件
3.1 HDFS 文件操作
3.1.1 基本文件命令
3.