-
一、Hadoop入门,了解什么是hadoop
1. Hadoop产生背景
2. Hadoop在大数据、云计算中的位置和关系
3. 国内外Hadoop应用案例介绍
4. 国内Hadoop的就业情况分析及课程大纲介绍
5. Hadoop生态圈以及各组成部分的简介
6. Hadoop核心MapReduce简单例子说明 -
二、分布式文件系统HDFS,是数据库管理员的基础课程
1. 分布式文件系统DFS简介
2. HDFS的系统组成介绍
3. HDFS的组成部分详解
4. 副本存放策略及路由规则
5. 命令行接口
6. Java接口
7. 客户端与HDFS的数据流讲解
8. HDFS的可用性(HA) -
三、初级MapReduce,成为Hadoop开发人员的基础课程
1. 如何理解map、reduce计算模型
2. 剖析伪分布式下MapReduce作业的执行过程
3. 序列化
4. MapReduce的类型与格式
5. MapReduce开发环境搭建
6. MapReduce应用开发
7. 更多示例讲解,熟悉MapReduce算法原理 -
四、高级MapReduce,高级Hadoop开发人员的关键课程
1. 使用压缩分隔减少输入规模
2. 利用Combiner减少中间数据
3. 编写Partitioner优化负载均衡
4. MapReduce优化
5. 编程实战 -
五、Hadoop集群与管理,是数据库管理员的高级课程
1. Hadoop集群的搭建
2. Hadoop集群的监控
3. Hadoop集群的管理
4. 集群下运行MapReduce程序 -
六、HBase基础知识,面向列的实时分布式数据库
1. HBase定义
2. HBase与RDBMS的对比
3. 数据模型
4. 系统架构
5. HBase上的MapReduce
6. 表的设计 -
七、HBase集群及其管理
1. 集群的搭建过程讲解
2. 集群的监控
3. 集群的管理 -
八、HBase客户端
1. HBase Shell以及演示
2. Java客户端以及代码演示 -
九、Hive
1. 数据仓库基础知识
2. Hive定义
3. Hive体系结构简介
4. Hive集群
5. 客户端简介 -
十、HiveQL
1. HiveQL定义
2. HiveQL与SQL的比较
3. 数据类型
4. 表与表分区概念
5. 表的操作与CLI客户端演示
6. 数据导入与CLI客户端演示
7. 查询数据与CLI客户端演示
8. 数据的连接与CLI客户端演示
9. 用户自定义函数(UDF)的开发与演
hadoop
最新推荐文章于 2018-05-30 14:07:49 发布