一、介绍 Hadoop介绍 Hadoop安装、集群搭建 二、HDFS HDFS分布式文件存储系统讲解 HDFS读写工作流程 SecondaryNameNode讲解 Hadoop一些常用的命令 三、MapReduce MapReduce MapReduce编程初体验 MapReduce程序运行模式 MapReduce执行流程 排序、序列化及反序列化 MapTask和ReduceTask运行机制、MapReduce的 shuffle 过程 shuffle阶段数据的压缩机制 reduce端join与map端join算法实现 自定义分区 自定义InputFormat、自定义OutputFormat