入门必备HDFS基础
大数据生态之起源——Hadoop
分布式文件系统HDFS架构和数据读写流程
hadoop伪分布式模式部署
HDFS常用命令
MapReduce原理
分布式计算框架MapReduce架构
MapReduce编程模型详解— —以经典Word Count为例
MapReduce的MapTask数量如何确定?
MapReduce灵魂——看不见的Shuffle
MapReduce原理分析:自定义输入格式InputFormat
MapReduce原理分析:自定义输出格式OutputFormat
MapReduce原理分析:自定义分区Partition和数据倾斜解决之道
编程技巧
Windows环境下MapReduce程序调试最有用技巧
应用案例
MapReduce应用案例1:数据去重
MapReduce应用案例2:简单数据排序
MapReduce应用案例3:简单数据倒排
MapReduce应用案例4:二次排序(组合键机制实现)
MapReduce应用案例5:倒排索引
MapReduce应用案例6:二度好友发现
案例Github地址
https://github.com/majxbear/mapreduce-applications