1 介绍
我们的txt文件内容是:
atguigu atguigu
ss ss
cls cls
jiao
banzhang
xue
hadoop
期望输出的结果是:
总体分析图为:
2 Mapper
首先写第一个Mapper,extends Mapper 查看默认值
KEYIN: 输入数据的key ,行内偏移量 改成LongWritable(如果写成Object容易报错) 读取txt里面的内容是一行一行读取的
VALUEIN: 输入数据的value, 改成Test 。 其实Text指的就是String类型
如前面 # 1 分析 :图中 Mapper分析结果后: 接收到的数据是形如:
atguigu 1
ss 1
上图对应下图是:
String int
atguigu 1
ss 1
那么atguigu和ss对应的是KEYOUT,即String类型 == Text类型
1和1 对应的是VALUEOUT ,即int类型==IntWritable类型
KEYOUT: 输出数据类型,改成Text
VALUEOUT: 输出的数据的value类型,改成IntWritable
最终为:
控制台输入:Map