一、MapReduce概述
1.MapReduce定义
2.MapReduce优缺点
——优点
——缺点
3.MapReduce核心思想
4.MapReduce进程
5.官方WordCount源码
6.常用数据序列化类型
7.MapReduce编程规范
8.WordCount案例实操
二、Hadoop序列化
1.序列化概述
2.自定义bean对象实现序列化接口(Writable)
3.序列化案例实操
三、MapReduce框架原理
1.InputFormat数据输入
——切片与MapTask并行度决定机制
——Job提交流程源码和切片源码详解
——FileInputFormat切片机制
——CombineTextInputFormat切片机制
——CombineTextInputFormat案例实操