setCombinerClass 的用法:
- 在MapReduce中,当map生成的数据郭大师,带宽就成了瓶颈,怎么精炼压缩传给Reduce 的数据,又不影响最终的结果?有一种方法就是Combiner,Combiner号称本地的Reduce,Reducer最终的输入,是Combiner的输出。
- Combiner是reducer来定义的,多数的情况下Combiner和Reducer处理的是同一中逻辑,所以job.setCombinerClass()的参数可以直接使用定义的Reducer,当然也可以单独定义一个有别于Reducer的Combiner,继承Reducer,写法基本上和定义reduce一样。