mapJoinJob.setMapOutputKeyClass(Text.class);
mapJoinJob.setMapOutputValueClass(SimItem.class);
这两个方法是map端输出的数据类型,默认的是LongWritable.class Text.class
KeyValueTextInputFormat
同样用于读取文件,如果行被分隔符(缺省是tab)分割为两部分,第一部分为key,剩下的部分为value;如果没有分隔符,整行作为 key,value为空
这里key value 格式均为Text