一、原理
- 框架:
- 参考 计算引擎解析——Shuffle
二、算法
- Hadoop进行全局排序:使用hadoop进行大规模数据的全局排序
- 两个表join:
MapReduce 中的两表 join 几种方案简介
使用MapReduce实现join操作 - 数据倾斜 浅析 Hadoop 中的数据倾斜
- 二次排序 hadoop之MapReduce自定义二次排序流程实例详解
- Combiner使用
三、常见面试题
hadoop面试题整理1
hadoop面试题整理2
一、原理
二、算法
三、常见面试题
hadoop面试题整理1
hadoop面试题整理2