MR 多mapper和reduc应用
在map读取的阶段,首先FileInputFormat会将输入文件分割成split。Split的数量取决于map的数量,影响map的数量的(split的数量)的主要因素:
1、文件的大小
当块(dfs.block.size)为128m时,如果输入文件为128m,会被划分为1个split;当块为256m,会被划分为2个split。
在map读取的阶段,首先FileInputFormat会将输入文件分割成split。Split的数量取决于map的数量,影响map的数量的(split的数量)的主要因素:
当块(dfs.block.size)为128m时,如果输入文件为128m,会被划分为1个split;当块为256m,会被划分为2个split。