1.程序的输入可能是一堆的文本文件,那么Mapper做的就是分析文本文件的每一行数据,从中提取有效的数据输出;
注意点:在对文本的处理过程中,Map过程的输入Key是一行数据的偏移量
2.Map过程的输出就是一系列的 key-value对;
3.通过Shuffle之后, 变成Reduce的输入, 这是相同的Key对应的Value被组合成了一个迭代器
4.Reduce的任务就是MapReduce程序具体的目标
1.程序的输入可能是一堆的文本文件,那么Mapper做的就是分析文本文件的每一行数据,从中提取有效的数据输出;
注意点:在对文本的处理过程中,Map过程的输入Key是一行数据的偏移量
2.Map过程的输出就是一系列的 key-value对;
3.通过Shuffle之后, 变成Reduce的输入, 这是相同的Key对应的Value被组合成了一个迭代器
4.Reduce的任务就是MapReduce程序具体的目标