hdfs原始数据:
hello a
hello b
map阶段:
输入数据:key-value对,key为偏移量(一个字符一个偏移量,换行也算一个)
<0,"hello a">
<8,"hello b">
输出数据:context上下文,存储输出的数据(伪代码如下)
map(key,value,context) {
String line = value; //hello a
String[] words = value.split("\t");
for(String word : words) {
//第一次hello