hadoop java开发 pdf_Hadoop应用开发技术详解 PDF 下载

相关截图:

aa347fc19cd31010573bd10ca971e20b.png

资料简介:

本书由资深Hadoop技术专家撰写,系统、全面、深入地讲解了Hadoop开发者需要掌握的技术和知识,包括HDFS的原理和应用、Hadoop文件I/O的原理和应用、MapReduce的原理和高级应用、MapReduce的编程方法和技巧,以及Hive、HBase和Mahout等技术和工具的使用。并且提供大量基于实际生产环境的案例,实战性非常强。   全书一共12章。第1~2章详细地介绍了Hadoop的生态系统、关键技术以及安装和配置;第3章是MapReduce的使用入门,让读者了解整个开发过程;第4~5章详细讲解了分布式文件系统HDFS和Hadoop的文件I/O;第6章分析了MapReduce的工作原理;第7章讲解了如何利用Eclipse来编译Hadoop的源代码,以及如何对Hadoop应用进行测试和调试;第8~9章细致地讲解了MapReduce的开发方法和高级应用;第10~12章系统地讲解了Hive、HBase和Mahout。   本书由资深Hadoop技术专家撰写,系统、全面、深地讲解了Hadoop发者需要掌握的技术和知识,包括HDFS的原理和应用、Hadoop文件I/O的原理和应用、MapReduce的原理和高级应用、MapReduce的编程方法和技巧,以及Hive、HBase和Mahout等技术和工具的使用。并且提供大量基于实际生产环境的案例,实战性非常强。

全书一共12章。第1~2章详细地介绍了Hadoop的生态系统、关键技术以及安装和配置;第3章是MapReduce的使用门,让读者了解整个发过程;第4~5章详细讲解了分布式文件系统HDFS和Hadoop的文件I/O;第6章分析了MapReduce的工作原理;第7章讲解了如何利用Eclipse来编译Hadoop的源代码,以及如何对Hadoop应用行测试和调试;第8~9章细致地讲解了MapReduce的发方法和高级应用;第10~12章系统地讲解了Hive、HBase和Mahout。

资料目录:

前言

第1章 Hadoop概述

1.1 Hadoop起源

1.2 Hadoop生态系统

1.3 Hadoop常用项目介绍

1.4 Hadoop在国内的应用

1.5 本章小结

第2章 Hadoop安装

2.1 Hadoop环境安装配置

2.2 Hadoop安装模式

2.3 如何使用Hadoop

2.4 本章小结

第3章 MapReduce快速入门

3.1 WordCount实例准备开发环境

3.2 MapReduce代码的实现

3.3 打包、部署和运行

3.4 本章小结

第4章 Hadoop分布式文件系统详解

4.1 认识HDFS

4.2 HDFS架构

4.3 Hadoop的RPC机制

4.4 HDFS的HA机制

4.5 HDFS的Federation机制

4.6 Hadoop文件系统的访问

4.7 Java API接口

4.8 维护HDFS

4.9 HDFS权限管理

4.10 本章小结

第5章 Hadoop文件I/O详解

5.1 Hadoop文件的数据结构

5.2 HDFS数据完整性

5.3 文件序列化

5.4 Hadoop的Writable类型

5.5 文件压缩

5.6 本章小结

第6章 MapReduce工作原理

6.1 MapReduce的函数式编程概念

6.2 MapReduce框架结构

6.3 MapReduce运行原理

6.4 MapReduce容错

6.5 Shuffle阶段和Sort阶段

6.6 任务的执行

6.7 作业调度器

6.8 自定义Hadoop调度器

6.9 YARN介绍

6.10 本章小结

第7章 Eclipse插件的应用

7.1 编译Hadoop源码

7.2 Eclipse安装MapReduce插件

7.3 MapReduce的Debug调试

7.4 单元测试框架MRUnit

7.5 本章小结

第8章 MapReduce编程开发

8.1 WordCount案例分析

8.2 输入格式

8.3 输出格式

8.4 压缩格式

8.5 MapReduce优化

8.6 辅助类

8.7 Streaming接口

8.8 本章小结

第9章 MapReduce高级应用

9.1 计数器

9.2 MapReduce二次排序

9.3 MapReduce中的Join算法

9.4 MapReduce从MySQL读写数据

9.5 Hadoop系统调优

9.6 本章小结

第10章 数据仓库工具Hive

10.1 认识Hive

10.2 Hive架构

10.3 Hive文件格式

10.4 Hive操作

10.5 Hive 复合类型

10.6 Hive的JOIN详解

10.7 Hive优化策略

10.8 Hive内置操作符与函数

10.9 Hive用户自定义函数接口

10.10 Hive的权限控制

10.11 应用实例:使用JDBC开发Hive程序

10.12 本章小结

第11章 开源数据库HBase

11.1 认识HBase

11.2 HBase设计

11.3 关键算法和流程

11.4 HBase安装

11.5 HBase的Shell操作

11.6 HBase客户端

11.7 本章小结

第12章 Mahout算法

12.1 Mahout的使用

12.2 Mahout数据表示

12.3 认识Taste框架

12.4 Mahout推荐器

12.5 推荐系统

12.6 本章小结

附录A Hive内置操作符与函数

A.1 关系运算

A.2 逻辑运算与数学运算

A.3 Hive逻辑运算

A.4 数值运算

A.5 日期函数

A.6 条件函数

A.7 字符串函数

A.8 集合统计函数

A.9 符合类型构建操作

A.10 复杂类型访问操作

A.11 复杂类型长度统计函数

附录B HBase默认配置解释

附录C Hadoop三个配置文件的参数含义说明

C.1 常用的端口配置

C.2 集群目录配置

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值