24 Interview Questions & Answers for Hadoop MapReduce developers
两个重要也很有趣的问题,第一,用户定义的任何一个reduce job在所有的map job结束之前都不会开始。第二,既然如此,我们为什么会看到Map%Complete还不足100%的时候,Reduce%Complete就开始5%或者10%了? 因为Reduce%Complete,从map产生的数据shuffle/transfer至reduce node的阶段就开始计数了。