在上一个阶段——HDFS,小菌出过一期HDFS的经典面试题,不知道小伙伴们掌握的怎么样吖(详情见–>《HDFS经典面试题》),本期同样在MapReduce快要结束阶段为大家带来MapReduce的经典面试题!
MapReduce核心思想
map负责切分,reduce负责合并(先分后合,分而治之)
如何理解偏移量
每行的行首到首行行首的距离
Suffle包含哪些步骤
分区(partition)------->排序(sort)------->数据优化计算(combine)------->